На Business Continuity Russia (проходящей в рамках выставки Инфобезопасность-2010 5-7 октября) я веду круглый стол «Чрезвычайные ситуации – реальный опыт выживания». Предварительное время – 6 октября, 13:45.
На круглом столе будут выступления компаний, которым пришлось в условиях реальной масштабной чрезвычайной ситуации использовать свои наработки в области непрерывности бизнеса.
Если вам есть, что рассказать – пишите, еще есть пара свободных слотов.
На этой неделе Москва начала сталкиваться с ранее невиданными природными явлениями, такими, как ураганы и ливни, накрывающие весьма ограниченную территорию. Но зато уж от души.
Одним из таких ураганов накрыло датацентр DataLine на Боровой. При этом были серьезны повреждены три внешних чиллера, что привело к временному выходу из строя системы кондиционирования ЦОД. Происшествие для ЦОДа более чем серьезное. Анализируя происходящее, хочется отметить три вещи:
- Коллеги довольно четко отработали ситуацию со своими клиентами, объяснив суть проблем и вместе приняв решение об управляемом выключении части оборудования.
- На сайте появилась весьма подробная информация о произошедшем, что позволило избежать ненужных слухов.
- Наконец, сами последствия аварии были ликвидированы вполне оперативно и профессионально.
Коллегам – респект, тем, кого пока не затронуло – хороший кейс.
Похоже, что знаменитый исландский вулкан никак не успокоится, и еще будет некоторое время доставлять нам неудобства. Постараемся извлечь из этого неприятного факта хоть какую-то пользу, и посмотрим на конкретных примерах, как нужно правильно взаимодействовать с потребителями в случае, если вы не можете предоставлять им свой сервис.
Итак, немного истории. То извержение вулкана, после которого начались серьезные перебои с авиасообщением, случилось 14 апреля. Утром 15 апреля начали закрываться европейские аэропорты (историю развития событий можно освежить в памяти здесь). Через какое-то время люди начали понимать, что помимо неожиданно исчезнувшего способа перемещаться в пространстве, они начали сталкиваться с такими проблемами, как задержки грузов, и т.п.
Любопытства ради я решил посмотреть, как компании, занимающиеся экспресс-доставкой, планируют выполнять свои обязательства. Заглянув 17 апреля на сайты основных игроков рынка, только у UPS я обнаружил какую-либо информацию на данную тему. К сожалению, я не знаю, было ли это прописано в планах обеспечения непрерывности бизнеса UPS, или было просто продиктовано здравым смыслом (если этот пост читают коллеги из UPS – буду признателен за комментарий), но представители компании сделали сразу несколько правильных вещей: Прочитать сообщение полностью »
Памяти польского борта №1
10.04.2010
Сегодня разбился борт №1 Польской Республики. Безусловно – трагедия, вне зависимости от того, чьи жизни унесла катастрофа.
Но как получилось так, что на одном борту оказалось такое количество – несколько десятков – представителей высшего руководства одного государства?
Когда в 1987 разбился самолет, на борту которого оказался президент Chevron и еще трое топ-менеджеров компании, это вызвало волну пересмотра корпоративных политик путешествий, в которые был добавлен запрет совместных перелетов/переездов для топ-менеджеров компаний (например, более 3 одним рейсом). Но проблема в том, что даже при наличии такой политики, очень непросто заставить топ-менеджеров следовать ей, ибо это яркий пример того, что политика создает неудобства в жизни, а те, люди, которым она создает неудобства, обладают достаточной властью, чтобы игнорировать отдельные правила.
Ровно так и получилось с польским бортом №1. Не скажу за всех погибших в катастрофе, но у польских военных (а в катастрофе погибло практически все руководство польских вооруженных сил) точно были четкие инструкции на этот счет после катастрофы 2008 года, в которой погибло несколько высокопоставленных офицеров Польских ВВС. Однако, на практике все оказалось ровно так, как не должно было быть – все оказались в одном самолете. Что послужило тому причиной, скорее всего, мы так и не узнаем.
Но есть вещи, которые в наших силах изменить, хотя бы частично. Поэтому в завершении, дабы не сотрясать воздух зря – пара практических советов по теме блога.
- Сделайте так (если это в ваших силах), чтобы в ваших корпоративных политиках появился запрет на совместные перемещения ключевых сотрудников организации на самолетах/поездах/т.п.
- Происшествия, подобные сегодняшнему – хороший шанс напомнить руководству/владельцам бизнеса о важности вопросов обеспечения непрерывности деятельности, в т.ч. и соблюдения имеющихся правил и политик.
Поговорим немного о такой теме, как оценка готовности ваших поставщиков (товаров, услуг, связи и т.п.) противостоять чрезвычайным ситуациям. На эту тему меня натолкнули два случившихся почти одновременно события. На прошлой неделе случился серьезный пожар у украинского хостинг-провайдера hosting.ua, и примерно тогда же SunGard объявил о выходе нового продукта из семейства Continuity Management Solution – Vendor Assessment. Основной интерес заключается не столько в самом продукте, сколько в заложенной в нем методологии – как надо оценивать своих поставщиков с тем, чтобы они не стали узким местом в вашей системе обеспечения непрерывности бизнеса.
Но сначала – небольшой экскурс в события недавних дней – пожар у украинского хостинг-провайдера hosting.ua. Как правило, выбирая внешний хостинг, мы подразумеваем, что наш провайдер уделяет серьезное внимание безопасности своей (и нашей) инфраструктуры, обеспечивает надежное резервное копирование и т.п. – волшебная формула »аутсорсинг – теперь ваши проблемы становятся нашими». Человеку вообще по природе своей свойственно надеяться на лучшее и верить в сказки
. 27 марта случилось то, чего точно не ожидали клиенты провайдера – ЦОД сгорел. Не дотла, но сильно. При этом система газового пожаротушения не сработала (оставим этот факт на совести строителей ЦОДа), а приехавшие пожарные водой довершили то, что не успел сделать огонь. Прочитать сообщение полностью »
Думаю, что почти все из вас хоть раз, да видели Центр управления инцидентами (ЦУИ). Большая часть – в кино или в новостях, а некоторые и в жизни. Вне зависимости от используемых технологий, специфики отрасли, места нахождения и т.п. функции у такого центра примерно одинаковые:
- Сбор информации о происходящем из всех доступных источников
- Консолидация, верификация и анализ информации
- Управление командами восстановления
- Информирование всех вовлеченных сторон – прессы, официальных органов, родственников потерпевших и т.п.
Теперь немного о технологиях. В течение долгого времени неизменными атрибутами такого центра были:
- Телефоны (много)

- Доски (whiteboards), на которых записывалась вся информация
- Карты, в которые втыкались разнообразные флажки.
В принципе, как и любая проверенная десятилетиями, если не веками, технология, она работает. Надежно? Да. Эффективно? Не очень. Давайте посмотрим, какие основные проблемы возникают.
А если завтра снег?
15.01.2010
Сегодня попалась на глаза статья уважаемого человека, Charlie Maclean-Bristol, написанная им по следам сурового похолодания и снежных заносов, выпавших на долю Великобритании в этом году. Не буду пересказывать статью целиком, но остановлюсь на нескольких моментах, показавшихся мне наиболее интересными, дополнив своими мыслями и рассуждениями.
Случится то происшествие, которого вы не ждете.
Казалось бы, ничего нового, про это говорится от раза к разу, но, несмотря ни на что, зачастую готовимся мы именно к тому, с чем уже сталкивались в обозримом прошлом. Типичный пример тому – меры, принимаемые TSA по обеспечению безопасности полетов после очередных [попыток] терактов, когда защитные меры почему то выстраиваются исходя из предположения, что следующая попытка теракта произойдет в точности по сценарию предыдущей. Мораль – планы обеспечения непрерывности деятельности должны быть:
а) достаточно гибкими
б) рассчитывать на самые худшие сценарии развития ситуации
Не рассчитывайте на работоспособность коммунальных служб
Непрерывность бизнеса и комсомольская пресса
06.12.2009
Жизнь учит нас, что ничему не учит… Точнее, учиться на чужих ошибках нам не интересно.
Люди, профессионально занимающиеся непрерывностью бизнеса, могут пропустить этот пост – это из серии «наболело». Постараюсь изложить свои эмоции, не используя профессиональных терминов с одной стороны, и нецензурных выражений с другой.
Три с половиной года назад сгорела редакция Комсомольской правды.
По заявлениям самой КП, «Номер, который уже был готов к подписанию, пришлось переписывать заново, потому что сгорели все серверы и вышли из строя компьютеры. Приютила нас на три дня «Экспресс-газета», которая находилась в соседнем здании. Ущерб от пожара насчитывает около 2 миллионов долларов.»
Сколько из этих двух миллионов пришлось на сгоревшие материальные ценности – я не знаю. Неизвестно также, пытался ли кто-то оценивать безвозвратно потерянную информацию. В любом случае - «Годы работы по созданию одного из крупнейших фотоархивов страны пошли насмарку. В редакции сгорели тысячи дисков с фотографиями за десятки лет. Выгорела ценнейшая библиотека.» [пруфлинк - здесь]
Теперь давайте посмотрим, что произошло на этой неделе с сайтом «Московского комсомольца». По сообщению самого МК, «Неустановленные пока злоумышленники атаковали интернет-сайт нашей газеты. В результате была уничтожена значительная часть информации на mk.ru, и ресурс был некоторое время недоступен для посетителей.[...] Команда сайта работает над восстановлением ресурса в первоначальном виде. К счастью, все тексты публикаций сохранились, однако значительная часть графических- и видеоматериалов была утрачена.»
Несмотря на то, что прямых материальных потерь не было (в смысле, ничего не сгорело, не было украдено и т.п.), по словам главного редактора МК «к сожалению, мы понесли большие финансовые потери, потому что появились большие вопросы с рекламодателями.»
В сухом остатке – безвозвратно погиб архив (или его часть), и на неопределенное время нарушена работоспособность сайта, являющегося, в частности, достаточно крупной рекламной площадкой.
Давайте теперь посмотрим, что общего в этих случаях, и что можно было бы сделать, чтобы избежать столь серьезных последствий.

