재해 복구란?

 

재해 복구는 장비로 인한 장애나 사이버 공격과 같은 인재 또는 자연 재해가 발생한 이후 조직이 IT 인프라에 대한 액세스와 기능을 복구하는 방법입니다. 다양한 재해 복구(DR) 방식을 재해 복구 계획의 일환으로 활용할 수 있습니다. DR은 비즈니스 연속성의 한 측면입니다.

 

VMware Site Recovery Manager Hands-on Lab

시작하기 

재해 복구의 작동 방식

재해 복구는 재해의 영향을 받지 않는 외부 위치에서 데이터 및 컴퓨터 처리 작업을 복제합니다. 자연 재해, 장비 고장, 사이버 공격으로 인해 서버가 다운되면 비즈니스는 데이터가 백업된 두 번째 위치에서 손실된 데이터를 복구해야 합니다. 가장 이상적인 경우는 조직이 컴퓨터 처리 작업을 원격 위치로 옮겨 운영을 계속하는 것입니다.


사이버 공격과 극단적인 기후 변화가 점점 더 자주 발생함에 따라 비즈니스 연속성을 위한 재해 복구 계획의 중요성도 커지고 있습니다. 재해의 잠재적 영향을 수량화하는 리스크 평가 및 비즈니스 영향 분석은 재해 복구 계획에 대한 경영진의 지원을 확보하는 데 효과적인 툴입니다.

 

재해 복구 계획에 포함되는 사항

적절한 재해 복구 계획을 마련하려면 비즈니스 연속성에 가장 중요한 시스템과 데이터 및 데이터 복구에 필수적인 단계를 적시한 문서화가 이루어져야 합니다. 계획에는 백업의 빈도를 명시하는 RPO(복구 시점 목표)와 재해 발생 후 허용 가능한 최대 다운타임을 정의하는 RTO(복구 시간 목표)가 포함되어야 합니다. 이러한 측정지표는 조직의 재해 복구 계획을 구성하는 IT 전략, 프로세스, 절차를 선택하는 기준이 되는 한계치를 설정합니다. 조직이 수용할 수 있는 다운타임의 양과 조직이 데이터를 백업하는 빈도에 맞게 조직의 재해 복구 전략을 수립할 수 있습니다. 마지막으로, 계획이 제대로 실행되는지 확인할 수 있도록 재해가 발생하기 전에 계획을 정기적으로 테스트하는 것이 중요합니다.

 

재해 복구의 유형

비즈니스는 다음과 같이 다양한 재해 복구 방식 중에서 선택하거나 여러 방식을 조합할 수 있습니다.

  • 백업: 가장 단순한 유형의 재해 복구로, 외부 또는 이동식 드라이브에 데이터를 저장하는 방식입니다. 하지만 IT 인프라 자체가 백업되는 것은 아니기 때문에 데이터를 백업하는 것만으로는 최소한의 비즈니스 연속성만 지원할 수 있습니다.
  • 콜드 사이트: 이 유형의 재해 복구에서는 자연 재해 또는 화재가 발생한 후, 거의 사용되지 않는 2차 시설에 기본적인 인프라를 구축하여 직원의 업무 공간을 마련합니다. 이렇게 하면 비즈니스 운영을 지속할 수 있어서 비즈니스 연속성에 도움은 되지만, 중요한 데이터를 보호하거나 복구할 수는 없기 때문에 콜드 사이트와 다른 재해 복구 방식을 병행해야 합니다.
  • 핫 사이트: 핫 사이트는 데이터 사본을 항상 최신 상태로 유지합니다. 핫 사이트는 구축에 오랜 시간이 소요되고 콜드 사이트보다 높은 비용이 들지만 다운타임을 크게 줄일 수 있습니다.
  • Disaster Recovery as a Service(DRaaS): 재해 또는 랜섬웨어 공격이 발생하는 경우 DRaaS 공급업체는 조직의 컴퓨터 처리 작업을 자체 클라우드 인프라로 옮겨 조직의 서버가 다운되더라도 벤더의 위치에서 비즈니스 운영을 중단 없이 지속할 수 있습니다. DRaaS 계획은 구독 또는 종량제 모델로 이용 가능합니다. 로컬 DRaaS 공급업체를 선택하면 장단점이 있습니다. 조직 위치에 더 가까운 DRaaS 서버로 옮기면 지연 시간이 짧아지지만, 광범위한 자연 재해가 발생하는 경우 가까운 DRaaS가 해당 재해의 영향을 받을 수 있습니다.
  • Back Up as a Service: 원격 위치에 데이터를 백업하는 방식과 마찬가지로, Back Up as a Service에서는 외부 공급업체가 조직의 데이터를 백업하지만 IT 인프라를 백업하지는 않습니다.
  • 데이터 센터 재해 복구: 데이터 센터의 물리적 요소를 통해 데이터를 보호하고 특정 유형의 재해 발생 시 더 신속한 재해 복구가 가능합니다. 예를 들어 화재 진압 툴은 데이터와 컴퓨터 장비를 화재로부터 보호하는 데 도움이 됩니다. 백업 전원은 정전 시 비즈니스가 운영을 중단하지 않고 지속할 수 있도록 해 줍니다. 하지만 이러한 물리적 자연 재해 복구 툴은 사이버 공격이 발생하는 경우에는 도움이 되지 않습니다.
  • 가상화: 조직은 물리적 재해의 영향을 받지 않는 외부 가상 머신에 특정 운영 및 데이터 또는 조직의 전체 컴퓨팅 환경을 복제하여 백업할 수 있습니다. 또한 재해 복구 계획의 일환으로 가상화를 활용하면 일부 재해 복구 프로세스를 자동화하여 모든 요소를 더 신속하게 복구할 수 있습니다. 가상화를 효과적인 재해 복구 툴로 활용하려면, 데이터와 워크로드를 자주 옮겨야 하며 조직 내에서 몇 대의 가상 머신이 운영되고 있는지 IT 팀과 원활히 소통해야 합니다.
  • 특정 시점 사본: 특정 시점 스냅샷이라고도 하는 특정 시점 사본은 특정 시점의 전체 데이터베이스에 대한 사본을 만듭니다. 이러한 백업을 통해 데이터를 복원할 수 있지만, 이는 해당 사본이 재해의 영향을 받지 않는 외부 또는 가상 머신에 저장된 경우에만 그러합니다.
  • 즉각적인 복구: 즉각적인 복구는 특정 시점 사본과 유사하나, 데이터베이스를 복사하는 대신 전체 가상 머신의 스냅샷을 생성합니다.

재해 복구 소프트웨어의 이점

어떤 조직도 재해 복구의 중요성을 간과할 수는 없습니다. 재해 계획을 구축할 때의 가장 중요한 이점 2가지는 다음과 같습니다.

  • 비용 절감: 재해 계획을 통해 비즈니스는 수십만 달러의 비용을 절감할 수 있고 나아가 자연 재해에서 살아남느냐 사업을 중단하느냐를 판가름할 수도 있습니다.
  • 신속한 복구: 재해 복구 전략과 사용되는 재해 복구 툴 유형에 따라, 비즈니스는 재해가 발생한 이후 훨씬 빠르게 운영을 복구하거나 아무 일도 일어나지 않은 것처럼 운영을 지속할 수도 있습니다. 재해 복구 전략과 계획을 갖추지 않은 비즈니스는 심각한 홍수나 허리케인이 닥쳤을 때 사업이 금방 무너지거나, 혹은 랜섬웨어 공격으로 인한 피해로 인해 복구가 불가능한 수준에 이를 수도 있습니다.

VMware 재해 복구 제품, 솔루션 및 참고 자료

가상 머신의 재해 복구

vSphere Replication은 유연하고 안정적이며 비용 효율적인 복제를 제공하여 환경에 있는 모든 가상 머신에 대한 데이터 보호 및 재해 복구를 지원합니다.

완벽한 비즈니스 연속성 및 재해 복구 솔루션

정전, 네트워크 문제, 작업자 오류 및 자연 재해는 모두 시스템 다운타임을 증가시키는 요인입니다. VMware는 중단의 영향을 최소화할 수 있도록 비즈니스 연속성 및 재해 복구(BC/DR) 솔루션으로 구성된 포괄적인 통합 포트폴리오를 제공합니다.

Fault Tolerance란?

VMware vSphere Fault Tolerance(FT)는 주 가상 머신을 미러링하는 가상 머신의 라이브 섀도 인스턴스를 생성하여 애플리케이션에 지속적인 가용성을 제공합니다(최대 4개의 가상 CPU 지원). 하드웨어 운영 중단이 발생하면 vSphere FT가 자동으로 페일오버를 트리거하여 다운타임을 제거하고 데이터 손실을 방지합니다.

가상 머신 라이브 마이그레이션의 정의와 작동 원리

다운타임을 감당할 수 있는 애플리케이션은 없지만, 다행히도 일부 다운타임은 완전히 방지할 수 있습니다. VMware vSphere vMotion은 한 서버에서 다른 서버로 다운타임 없이 워크로드를 라이브 마이그레이션합니다.

VMware Site Recovery

온디맨드 DRaaS(Disaster Recovery as-a-Service)를 통해 온프레미스 및 VMware Cloud on AWS 모두에서 워크로드를 보호하십시오.

단순하고 안정적인 재해 복구 소프트웨어

정책 기반 관리, 무중단 테스트, 자동 조정을 제공하는 업계 최고의 재해 복구 소프트웨어에 대해 알아보십시오.