Аварийное восстановление

 

Аварийное восстановление — это метод восстановления работоспособности ИТ-инфраструктуры и доступа к ней после стихийного бедствия или сбоя, возникшего по вине человека, например после кибератаки или отказа оборудования. Частью плана аварийного восстановления могут быть самые разные методы. Аварийное восстановление — это один из аспектов непрерывности бизнеса.

 

Практическое занятие по VMware Site Recovery Manager

Начать 

Принципы работы аварийного восстановления

В основе аварийного восстановления лежит возможность репликации данных и процессов их обработки во внешней среде, которая не пострадала при возникновении непредвиденной ситуации. Если серверы вышли из строя из-за стихийного бедствия, сбоя оборудования или кибератак, компании необходимо восстановить потерянные данные из другого расположения, в котором хранятся их резервные копии. В идеале организация должна иметь возможность перенести обработку данных в это удаленное расположение, чтобы продолжить работу.


Поскольку кибератаки и стихийные бедствия происходят все чаще, планирование аварийного восстановления становится более важной задачей для обеспечения непрерывности бизнеса. Оценка рисков и анализ последствий для бизнеса, который количественно определяет потенциальные последствия аварийной ситуации, — эффективные средства, помогающие заручиться поддержкой руководства в реализации плана аварийного восстановления.

 

Компоненты плана аварийного восстановления

Эффективный план аварийного восстановления включает в себя документацию о наиболее важных для непрерывности бизнеса системах и данных, а также перечень действий, необходимых для восстановления этих данных. План должен содержать информацию о целевой точке восстановления, которая определяет частоту выполнения резервного копирования, и целевом времени восстановления, то есть максимальном времени простоя после аварии. Эти показатели создают ограничения, в зависимости от которых выбираются ИТ-стратегия, процессы и процедуры, входящие в план аварийного восстановления организации. Время простоя, допустимое для организации, и частота резервного копирования ее данных также определяют стратегию аварийного восстановления компании. Наконец, важно регулярно тестировать план, чтобы быть полностью готовыми к аварийным ситуациям.

 

Типы аварийного восстановления

Есть множество методов аварийного восстановления. Компании могут выбрать один из них или совместить несколько подходов.

  • Резервное копирование — самый простой тип аварийного восстановления, который подразумевает хранение данных в другом расположении или на удаленном накопителе. Однако одно резервное копирование обеспечивает лишь минимальную защиту непрерывности бизнеса, поскольку нельзя сделать резервную копию самой ИТ-инфраструктуры.
  • «Холодная» резервная площадка. Этот тип аварийного восстановления подразумевает, что организация устанавливает базовую инфраструктуру на другом, редко используемом объекте, где сотрудники смогут работать после стихийного бедствия или пожара. Это способствует поддержанию непрерывности бизнеса, поскольку работа продолжается. Однако такой подход не обеспечивает защиту или восстановление важных данных, поэтому его необходимо совмещать с другими типами аварийного восстановления.
  • «Горячая» резервная площадка — постоянно поддерживает наличие актуальных копий данных. Этот метод более трудоемкий и дорогой, чем предыдущий, но значительно сокращает время простоев.
  • Аварийное восстановление как услуга (DRaaS). В случае аварии или кибератаки поставщик услуги DRaaS перемещает вычислительные процессы организации в собственную облачную инфраструктуру. Это позволяет компании бесперебойно продолжать работу из расположения поставщика, даже если ее серверы отключены. Планы DRaaS доступны как в виде подписки, так и с оплатой по мере использования. Выбор локального поставщика DRaaS имеет как преимущества, так и недостатки: при переходе на серверы DRaaS, которые находятся поблизости от расположения организации, задержка будет меньше, но в случае масштабного стихийного бедствия среда DRaaS, расположенная неподалеку, точно так же пострадает.
  • Резервное копирование как услуга. Как и в случае с резервным копированием в удаленном расположении, сторонний поставщик услуг делает резервную копию данных организации вне ее ИТ-инфраструктуры.
  • Аварийное восстановление ЦОД. Физические элементы ЦОД могут обеспечить защиту данных и способствовать ускоренному аварийному восстановлению при некоторых типах аварий. Например, средства пожаротушения помогут защитить данные и компьютерную технику при пожаре. Резервный источник питания поможет компаниям справиться с перебоями в электроснабжении без перерывов в работе. К сожалению, ни одно из этих физических средств аварийного восстановления не поможет при кибератаке.
  • Виртуализация. Организации могут делать резервные копии некоторых процессов и данных или даже создавать рабочие реплики целых вычислительных сред на внешних ВМ, которые не будут затронуты при физических авариях. Использование виртуализации в рамках плана аварийного восстановления также позволяет компаниям автоматизировать часть соответствующих процессов и ускорить восстановление. Чтобы виртуализация стала эффективным средством аварийного восстановления, очень важно часто переносить данные и рабочие нагрузки, а также наладить коммуникацию с командой ИТ-специалистов, отвечающих за количество работающих ВМ в рамках организации.
  • Копии на определенный момент времени. Такие копии, также известные как моментальные снимки, позволяют делать копию всей базы данных в указанный момент времени. Данные можно восстановить из этой резервной копии, но только если она хранится во внешней среде или на ВМ, не поврежденной при аварии.
  • Мгновенное восстановление. Этот метод аналогичен копированию на определенный момент времени, однако при мгновенном восстановлении вместо копирования базы данных делается снимок всей ВМ.

Преимущества ПО для аварийного восстановления

Ни одна организация не может игнорировать процесс аварийного восстановления. Наличие плана на случай аварии обеспечивает два основных преимущества:

  • Сокращение расходов. Планирование на случай аварии позволяет компании сэкономить сотни тысяч долларов, а это может быть решающим фактором, который поможет избежать банкротства при стихийном бедствии.
  • Ускоренное восстановление. В зависимости от стратегии аварийного восстановления и используемых средств компании могут быстрее вернуться к работе после аварии или даже продолжить работу без прерываний. Организации, не имеющие стратегии и плана аварийного восстановления, могут разориться из-за крупного наводнения или урагана либо понести настолько большой финансовый ущерб от кибератаки, что их восстановление будет невозможно.

Продукты, решения и ресурсы VMware, связанные с аварийным восстановлением

Аварийное восстановление виртуальных машин

Технология vSphere Replication, обеспечивающая гибкую, надежную и экономичную репликацию, гарантирует защиту данных и аварийное восстановление всех ВМ в вашей среде.

Комплексное решение по обеспечению непрерывности бизнеса и аварийному восстановлению

Перебои в электроснабжении, сетевые неполадки, ошибки операторов и стихийные бедствия могут привести к простою систем. VMware предлагает комплексный портфель интегрированных решений по обеспечению непрерывности бизнеса и аварийному восстановлению, помогающих свести к минимуму ущерб от нарушения работы.

Отказоустойчивость

Решение VMware vSphere Fault Tolerance (FT) обеспечивает непрерывную доступность приложений (до четырех виртуальных ЦП) за счет создания фонового экземпляра ВМ, работающего синхронно с основным. В случае сбоя оборудования vSphere FT автоматически запускает аварийное переключение, чтобы избежать простоя и потери данных.

Миграция работающих ВМ и принципы ее работы

Простои недопустимы для любых приложений, но, к счастью, некоторых простоев вполне можно избежать. VMware vSphere vMotion — это функция, которая дает возможность без простоев переносить активные рабочие нагрузки с одного сервера на другой.

VMware Site Recovery

Обеспечьте защиту рабочих нагрузок как в локальной среде, так и в облачной инфраструктуре VMware Cloud on AWS, воспользовавшись моделью аварийного восстановления как услуги (DRaaS).

Удобное и надежное ПО для аварийного восстановления

Узнайте больше о ведущем в отрасли ПО для аварийного восстановления, которое обеспечивает автоматизированную оркестрацию на основе политик и тестирование без прерывания рабочих процессов.