Специалисты в области информационных технологий (ИТ) признали важность аварийное восстановление в течение многих десятилетий. Высокопоставленные интернет-черви, стихийные бедствия и другие громкие нарушения безопасности все служат напоминанием о необходимости надлежащего планирования для аварийного восстановления и других проблем непрерывности бизнеса.
Аварийное восстановление применяется в основном для корпораций и других крупных организаций, но те же основные принципы применяются и в домашних сетях.
Что такое аварийное восстановление?
Аварийное восстановление включает в себя ряд действий, которые необходимо предпринять в случае крупных незапланированных отключений для минимизации их неблагоприятных последствий. В сетях бедствия могут возникать в результате таких событий, как
- Компьютерные вредоносные программы
- Сбои электроэнергии
- Хакерские атаки
- Подземные кабельные прорези или отказы
- Огонь, наводнение, землетрясение и другие стихийные бедствия на объекте
- Ошибки в системном администрировании
Связанная с этим концепция Непрерывность бизнеса включает в себя обеспечение того, чтобы критические бизнес-процессы организации, включая системы, использующие ИТ-системы, можно было поддерживать в случае катастрофы.
Почему аварийное восстановление важно
При выполнении хорошо, процедуры аварийного восстановления экономят большие суммы денег. Финансовое влияние на корпорации даже на несколько часов потери сети и подключения к Интернету легко распространяется на миллионы долларов. Восстановление после стихийных бедствий также может улучшить качество жизни людей, и это может даже спасти жизни. Потеря контакта сотового телефона с друзьями и семьей становится чрезвычайно разрушительной во время чрезвычайных ситуаций.
Все сказанное, что инвестиции в непрерывность бизнеса должны быть сбалансированы с практическими соображениями издержек и сложности подготовки к неизвестному будущему:
- Стоимость - комплексное аварийное восстановление является чрезмерно дорогостоящим
- способность быть свидетелем в суде - планы аварийного восстановления, которые отлично смотрятся на бумаге, но технически недоказанные, скорее всего, не удастся на практике
- чрезмерное внимание к бэк-офису - легко получить удовольствие от решений для серверной комнаты, но без достаточных условий для людей и инфраструктуры на стороне клиента, непрерывность бизнеса не произойдет
В домашних сетях отсутствует дорогостоящее оборудование крупного бизнеса, но сохранение данных и коммуникаций может быть одинаково важным.
Планирование аварийного восстановления
Наилучший подход к аварийному восстановлению ориентирован прежде всего на планирование и профилактику. В то время как землетрясения и террористические атаки, как правило, трудно предвидеть, многие другие сценарии бедствий могут быть проанализированы подробно.
Для тех событий, которые не могут быть предотвращены, план аварийного восстановления ИТ учитывает необходимость
- детектировать сбоев или других последствий стихийных бедствий как можно быстрее
- Поставить в известность любых затрагиваемых сторон, с тем чтобы они могли принять меры
- изолировать затронутые системы, чтобы ущерб не мог распространяться
- Ремонт критически важных систем, чтобы операции можно было возобновить
Они в совокупности называются деятельностью по управлению рисками или смягчению рисков.
Методы аварийного восстановления
Во всех хороших планах по аварийному восстановлению ИТ рассматриваются три основных компонента операций: данные, системы и люди.
С технической точки зрения большинство организаций полагаются на избыточность чтобы сделать возможным восстановление данных и систем. Резервирование позволяет мгновенно вводить вторичные данные или системные ресурсы в службу, если первичные ресурсы не работают или иным образом становятся недоступными. Организации могут реплицировать серверы и другое критическое оборудование в разных местах для защиты от любой точки отказа.
В то время как традиционное зеркальное отображение дисков обеспечивает доступность данных в обычных ситуациях, оно работает только на коротких расстояниях. Резервные копии позволяют выполнять моментальные снимки данных, которые должны быть захвачены, перемещены в удаленные местоположения. Традиционные стратегии резервного копирования сети, например, периодически архивируют копии критически важных данных, чтобы при необходимости их можно было восстановить позже. Если резервные копии хранятся на месте или только в одном месте, их значение для аварийного восстановления низкое. Более крупные организации инвестируют в технологию сетей хранения данных (SAN) для более широкого распространения данных по своим внутренним сетям. Некоторые также используют сторонний хостинг услуги для облачного хранения.
Домашние сети могут также использовать сетевые резервные и облачные решения для хранения данных, чтобы лучше управлять своими рисками.
Другие общие методы поддержки планов аварийного восстановления включают:
- Назначение людей в организации со специальными ролями в случае стихийного бедствия и предоставление им необходимой подготовки
- Выполнение упражнений по аварийному восстановлению, которые применяются против конкретных сценариев восстановления