На Business Continuity Russia (проходящей в рамках выставки Инфобезопасность-2010 5-7 октября) я веду круглый стол «Чрезвычайные ситуации – реальный опыт выживания». Предварительное время – 6 октября, 13:45.

На круглом столе будут выступления компаний, которым пришлось в условиях реальной масштабной чрезвычайной ситуации использовать свои наработки в области непрерывности бизнеса.

Если вам есть, что рассказать – пишите, еще есть пара свободных слотов.

На этой неделе Москва начала сталкиваться с ранее невиданными природными явлениями, такими, как ураганы и ливни, накрывающие весьма ограниченную территорию. Но зато уж от души.

Одним из таких ураганов накрыло датацентр DataLine на Боровой.  При этом были серьезны повреждены три внешних чиллера, что привело к временному выходу из строя системы кондиционирования ЦОД. Происшествие для ЦОДа более чем серьезное. Анализируя происходящее, хочется отметить три вещи:

  1. Коллеги довольно четко отработали ситуацию со своими клиентами, объяснив суть проблем и вместе приняв решение об управляемом выключении части оборудования.
  2. На сайте появилась весьма подробная информация о произошедшем, что позволило избежать ненужных слухов.
  3. Наконец, сами последствия аварии были ликвидированы вполне оперативно и профессионально.

Коллегам – респект, тем, кого пока не затронуло – хороший кейс.

Похоже, что знаменитый исландский вулкан никак не успокоится, и еще будет некоторое время доставлять нам неудобства. Постараемся извлечь из этого неприятного факта хоть какую-то пользу, и посмотрим на конкретных примерах, как нужно правильно взаимодействовать с потребителями в случае, если вы не можете предоставлять им свой сервис.

Итак, немного истории. То извержение вулкана, после которого начались серьезные перебои с авиасообщением, случилось 14 апреля.  Утром 15 апреля начали закрываться европейские аэропорты (историю развития событий можно освежить в памяти здесь). Через какое-то время люди начали понимать, что помимо неожиданно исчезнувшего  способа перемещаться в пространстве, они начали  сталкиваться с такими проблемами, как задержки грузов, и т.п.

Любопытства ради я решил посмотреть, как компании, занимающиеся экспресс-доставкой, планируют выполнять свои обязательства. Заглянув 17 апреля на сайты основных игроков рынка, только у UPS я обнаружил какую-либо  информацию на данную тему. К сожалению, я не знаю, было ли это прописано в планах обеспечения непрерывности бизнеса UPS, или было просто продиктовано здравым смыслом (если этот пост читают коллеги из UPS – буду признателен за комментарий), но представители компании сделали сразу несколько правильных вещей: Прочитать сообщение полностью »

Сегодня разбился борт №1 Польской Республики.  Безусловно – трагедия, вне зависимости от того, чьи жизни унесла катастрофа.

Но как получилось так, что на одном борту оказалось такое количество – несколько десятков – представителей высшего руководства одного государства?

Когда в 1987 разбился самолет, на борту которого оказался президент Chevron и еще трое топ-менеджеров компании, это вызвало волну пересмотра корпоративных политик путешествий, в которые был добавлен запрет совместных перелетов/переездов для топ-менеджеров компаний (например, более 3 одним рейсом). Но проблема в том, что даже при наличии такой политики, очень непросто заставить топ-менеджеров следовать ей, ибо это яркий пример того,  что политика создает неудобства в жизни, а те, люди, которым она создает неудобства, обладают достаточной властью, чтобы игнорировать отдельные правила.

Ровно так и получилось с польским бортом №1. Не скажу за всех погибших в катастрофе, но у польских военных (а в катастрофе погибло практически все руководство польских вооруженных сил) точно были четкие инструкции на этот счет после катастрофы 2008 года, в которой погибло несколько высокопоставленных офицеров Польских ВВС. Однако, на практике все оказалось ровно так, как не должно было быть – все оказались в одном самолете. Что послужило тому причиной, скорее всего, мы так и не узнаем.

Но есть вещи, которые в наших силах изменить, хотя бы частично. Поэтому в завершении, дабы не сотрясать воздух зря – пара практических советов по теме блога.

  1. Сделайте так (если это в ваших силах), чтобы в ваших корпоративных политиках появился запрет на совместные перемещения ключевых сотрудников организации на самолетах/поездах/т.п.
  2. Происшествия, подобные сегодняшнему – хороший шанс напомнить руководству/владельцам бизнеса о важности вопросов обеспечения непрерывности деятельности, в т.ч. и соблюдения имеющихся правил и политик.

Поговорим немного о такой теме, как оценка готовности ваших поставщиков (товаров, услуг, связи и т.п.) противостоять чрезвычайным ситуациям. На эту тему меня натолкнули два случившихся почти одновременно события. На прошлой неделе случился серьезный пожар у украинского хостинг-провайдера hosting.ua, и примерно тогда же SunGard объявил о выходе нового продукта из семейства Continuity Management SolutionVendor Assessment. Основной интерес заключается не столько в самом продукте, сколько в заложенной в нем методологии – как надо оценивать своих поставщиков с тем, чтобы они не стали узким местом в вашей системе обеспечения непрерывности бизнеса.

Но сначала – небольшой экскурс в события недавних  дней – пожар у украинского хостинг-провайдера hosting.ua. Как правило, выбирая внешний хостинг, мы подразумеваем, что наш провайдер уделяет серьезное внимание безопасности своей (и нашей) инфраструктуры, обеспечивает надежное резервное копирование и т.п. – волшебная формула  »аутсорсинг – теперь ваши проблемы становятся нашими». Человеку вообще по природе своей свойственно надеяться на лучшее и верить в сказки :) .  27 марта случилось то, чего точно не ожидали клиенты провайдера – ЦОД сгорел. Не дотла, но сильно.  При этом система газового пожаротушения не сработала (оставим этот факт на совести строителей ЦОДа), а приехавшие пожарные водой довершили то, что не успел сделать огонь. Прочитать сообщение полностью »

Думаю, что почти все из вас  хоть раз, да видели Центр управления инцидентами (ЦУИ). Большая часть – в кино или в новостях, а некоторые и в жизни. Вне зависимости от используемых технологий, специфики отрасли, места нахождения и т.п. функции у такого центра примерно одинаковые:

  • Сбор информации о происходящем из всех доступных источников
  • Консолидация, верификация и анализ информации
  • Управление командами восстановления
  • Информирование всех вовлеченных сторон – прессы, официальных органов, родственников потерпевших и т.п.

Теперь немного о технологиях. В течение долгого времени неизменными атрибутами такого центра были:

  • Телефоны (много)
  • Доски (whiteboards), на которых записывалась вся информация
  • Карты, в которые втыкались разнообразные флажки.

В принципе, как и любая проверенная десятилетиями, если не веками, технология, она работает. Надежно? Да. Эффективно? Не очень. Давайте посмотрим, какие основные проблемы возникают.

Прочитать сообщение полностью »

Сегодня попалась на глаза статья уважаемого человека, Charlie Maclean-Bristol, написанная им по следам сурового похолодания и снежных заносов, выпавших на долю Великобритании в этом году. Не буду пересказывать статью целиком, но остановлюсь на нескольких моментах, показавшихся мне наиболее интересными, дополнив своими мыслями и рассуждениями.

Случится то происшествие, которого вы не ждете.

Казалось бы, ничего нового, про это говорится от раза к разу, но, несмотря ни на что, зачастую готовимся мы именно к тому, с чем уже сталкивались в обозримом прошлом. Типичный пример тому – меры, принимаемые TSA по обеспечению безопасности полетов после очередных [попыток] терактов, когда защитные меры почему то выстраиваются исходя из предположения, что следующая попытка теракта произойдет в точности по сценарию предыдущей. Мораль – планы обеспечения непрерывности деятельности должны быть:
а) достаточно гибкими
б) рассчитывать на самые худшие сценарии развития ситуации

Не рассчитывайте на работоспособность коммунальных служб

Прочитать сообщение полностью »

Жизнь учит нас, что ничему не учит… Точнее, учиться на чужих ошибках нам не интересно.

Люди, профессионально занимающиеся непрерывностью бизнеса, могут пропустить этот пост – это из серии «наболело». Постараюсь изложить свои эмоции, не используя  профессиональных терминов с одной стороны, и нецензурных выражений с другой.

Три с половиной года назад сгорела редакция Комсомольской правды.

По заявлениям самой КП, «Номер, который уже был готов к подписанию, пришлось переписывать заново, потому что сгорели все серверы и вышли из строя компьютеры. Приютила нас на три дня «Экспресс-газета», которая находилась в соседнем здании. Ущерб от пожара насчитывает около 2 миллионов долларов.»

Сколько из этих двух миллионов пришлось на сгоревшие материальные ценности – я не знаю. Неизвестно также, пытался ли кто-то оценивать безвозвратно потерянную информацию. В любом случае - «Годы работы по созданию одного из крупнейших фотоархивов страны пошли насмарку. В редакции сгорели тысячи дисков с фотографиями за десятки лет. Выгорела ценнейшая библиотека.» [пруфлинк - здесь]

Теперь давайте посмотрим, что произошло на этой неделе с сайтом «Московского комсомольца». По сообщению самого МК, «Неустановленные пока злоумышленники атаковали интернет-сайт нашей газеты. В результате была уничтожена значительная часть информации на mk.ru, и ресурс был некоторое время недоступен для посетителей.[...] Команда сайта работает над восстановлением ресурса в первоначальном виде. К счастью, все тексты публикаций сохранились, однако значительная часть графических- и видеоматериалов была утрачена.»

Несмотря на то, что прямых материальных потерь не было (в смысле, ничего не сгорело, не было украдено и т.п.), по словам главного редактора МК «к сожалению, мы понесли большие финансовые потери, потому что появились большие вопросы с рекламодателями.»

В сухом остатке – безвозвратно погиб архив (или его часть), и на неопределенное время нарушена работоспособность сайта, являющегося, в частности, достаточно крупной рекламной площадкой.

Давайте теперь посмотрим, что общего в этих случаях, и что можно было бы сделать, чтобы избежать столь серьезных последствий.

Прочитать сообщение полностью »