什么是灾难恢复?

 

灾难恢复是企业在自然或人为灾难(如设备故障或网络攻击)后用于恢复对 IT 基础架构的访问以及 IT 基础架构功能的方法。灾难恢复计划中可以包含各种灾难恢复 (DR) 方法。灾难恢复是业务连续性的一方面。

 

VMware Site Recovery Manager 云中动手实验。

由此开始 

灾难恢复如何工作?

灾难恢复需要在不受灾难影响的远程部署位置执行数据复制和计算机处理。当服务器因自然灾害、设备故障或网络攻击而停止运行时,企业需要从另一个具有数据备份的位置恢复丢失的数据。在理想情况下,企业也可以将其计算机处理转移到远程位置进行,以便继续运维。


随着网络攻击和极端天气事件更加常见,规划灾难恢复对实现业务连续性变得更加重要。可对灾难潜在影响进行量化的风险评估和企业影响分析是为灾难恢复计划提供管理支持的有效工具。

 

灾难恢复计划包含什么内容?

良好的灾难恢复计划包括有关对实现业务连续性最为重要的系统和数据的文档,以及用于恢复数据的必要步骤。该计划应包括恢复点目标 (RPO) 和恢复时间目标 (RTO),前者指明备份频率,后者定义允许的灾难后最长停机时间。这些指标设置了一些限制,用于指导选择构成企业灾难恢复计划的 IT 战略、流程和规程。企业能够接受的最长停机时间和企业备份其数据的频率将影响企业的灾难恢复战略。最后,应在灾难来袭之前定期测试计划,确保计划能够正常运行,这非常重要。

 

灾难恢复有哪些类型?

企业可以从各种灾难恢复方式中进行选择,也可以结合使用多种方式:

  • 备份:这是最简单的一种灾难恢复,需要将数据存储在异地或可移除驱动器上。但是,仅仅依靠对数据进行备份,在实现业务连续性方面提供的帮助微乎其微,这是因为 IT 基础架构本身并未备份。
  • 冷站点:在此类型的灾难恢复中,企业会将基本基础架构设置在很少使用的场所中,在发生自然灾难或火灾后,该场所可作为员工的工作场所。借助冷站点,企业可以继续运维,因而,对于实现业务连续性非常有帮助。但是,冷站点无法保护或恢复重要数据,因此必须与其他灾难恢复方法结合使用。
  • 热站点:热站点始终维护最新的数据副本。设置热站点会比较耗时,并且热站点的成本要高于冷站点,但热站点能大幅缩短停机时间。
  • 灾难恢复即服务 (DRaaS):如果发生灾难或勒索软件攻击,DRaaS 提供商会将企业的计算机处理移至自己的云计算基础架构中进行,使企业可以无缝地从供应商所在位置继续运维(即使企业服务器已停机)。通过订阅或按使用付费模式,可以获得 DRaaS 计划。选择当地的 DRaaS 提供商有利有弊:转移到离企业所在位置更近的 DRaaS 服务器可以缩短延迟,但如果遇到大范围自然灾害,附近的 DRaaS 也会受到该自然灾害的影响。
  • 备份即服务:类似于在远程位置备份数据,通过备份即服务,第三方提供商可备份企业的数据,而不是 IT 基础架构。
  • 数据中心灾难恢复:数据中心的物理装置可以保护数据,还可以在某些特定类型的灾难后帮助加快灾难恢复。例如,灭火工具有助于数据和计算机设备幸免于火灾。备份电源有助于企业度过停电期,而不必停止运营。遗憾的是,在发生网络攻击时,这些物理灾难恢复工具均无法提供任何帮助。
  • 虚拟化:企业可以将某些运维和数据,甚至是企业整个计算环境的工作副本都备份到不受物理灾难影响的异地虚拟机中。通过使用虚拟化作为灾难恢复计划的一部分,企业还能自动执行某些灾难恢复流程,更加快速地将一切恢复联机状态。为了使虚拟化成为高效的灾难恢复工具,频繁地转移数据和工作负载是必不可少的,因为这是 IT 团队内部针对“企业中运行着多少台虚拟机”进行沟通的良好方式。
  • 时间点副本:时间点副本也称为“时间点快照”,可在指定时间为整个数据库创建副本。系统将通过此备份对数据进行还原,但前提是此副本存储在异地或不受灾难影响的虚拟机中。
  • 即时恢复:即时恢复与时间点副本类似,但即时恢复不复制数据库,而是为整台虚拟机拍摄快照。

灾难恢复软件有哪些优势?

忽视灾难恢复所造成的代价是任何企业都承受不起的。制定好灾难计划有两个最重要的好处:

  • 节省成本:灾难计划可为企业节省数十万美元的费用,甚至能决定企业是挺过自然灾难还是倒闭。
  • 加快恢复:根据使用的灾难恢复战略以及灾难恢复工具类型,企业可以在发生灾难后更加快速地启动并运行,甚至能够像什么都没有发生一样继续运维。不制定灾难恢复战略和计划的企业很容易就会被特大洪水或飓风摧毁,或者因受到勒索软件攻击而一蹶不振。

VMware 灾难恢复产品、解决方案和资源

虚拟机的灾难恢复

vSphere Replication 提供灵活、可靠和经济有效的复制功能,以支持环境中所有虚拟机的数据保护和灾难恢复。

一套完备的业务连续性和灾难恢复解决方案

电力中断、网络问题、人为错误和自然灾害都可能导致系统停机。为最大限度降低任何中断的影响,VMware 提供了一套完备、集成的业务连续性和灾难恢复 (BC/DR) 解决方案。

什么是 Fault Tolerance?

VMware vSphere Fault Tolerance (FT) 通过创建可以镜像主虚拟机的虚拟机实时卷影实例,为应用(最多有四个虚拟 CPU)提供持续可用性。如果发生硬件故障,则 vSphere FT 会自动触发故障转移,以消除停机时间并防止数据丢失。

什么是虚拟机实时迁移及其工作原理?

任何应用都无法承受停机,但幸运的是,一些停机完全可以避免。使用 VMware vSphere vMotion,可将工作负载从一台服务器实时迁移到另一台服务器,且无需停机。

VMware Site Recovery

借助按需“灾难恢复即服务”,可保护本地和 VMware Cloud on AWS 中的工作负载。

简单、可靠的灾难恢复软件

了解业界领先的灾难恢复软件,该款软件可提供基于策略的管理、无中断测试和自动化编排功能。