Думаю, что почти все из вас хоть раз, да видели Центр управления инцидентами (ЦУИ). Большая часть – в кино или в новостях, а некоторые и в жизни. Вне зависимости от используемых технологий, специфики отрасли, места нахождения и т.п. функции у такого центра примерно одинаковые:
- Сбор информации о происходящем из всех доступных источников
- Консолидация, верификация и анализ информации
- Управление командами восстановления
- Информирование всех вовлеченных сторон – прессы, официальных органов, родственников потерпевших и т.п.
Теперь немного о технологиях. В течение долгого времени неизменными атрибутами такого центра были:
- Телефоны (много)

- Доски (whiteboards), на которых записывалась вся информация
- Карты, в которые втыкались разнообразные флажки.
В принципе, как и любая проверенная десятилетиями, если не веками, технология, она работает. Надежно? Да. Эффективно? Не очень. Давайте посмотрим, какие основные проблемы возникают.
В последний день прошлого года Минюст зарегистрировал приказ Министерства экономического развития №470 от 16 ноября 2009 года «О требованиях к технологическим, программным и лингвистическим средствам обеспечения пользования официальными сайтами федеральных органов исполнительной власти».
Приказ, среди прочего, устанавливает целевые показатели восстановления для сайтов федеральных органов:
RTO – 4 часа
А если завтра снег?
15.01.2010
Сегодня попалась на глаза статья уважаемого человека, Charlie Maclean-Bristol, написанная им по следам сурового похолодания и снежных заносов, выпавших на долю Великобритании в этом году. Не буду пересказывать статью целиком, но остановлюсь на нескольких моментах, показавшихся мне наиболее интересными, дополнив своими мыслями и рассуждениями.
Случится то происшествие, которого вы не ждете.
Казалось бы, ничего нового, про это говорится от раза к разу, но, несмотря ни на что, зачастую готовимся мы именно к тому, с чем уже сталкивались в обозримом прошлом. Типичный пример тому – меры, принимаемые TSA по обеспечению безопасности полетов после очередных [попыток] терактов, когда защитные меры почему то выстраиваются исходя из предположения, что следующая попытка теракта произойдет в точности по сценарию предыдущей. Мораль – планы обеспечения непрерывности деятельности должны быть:
а) достаточно гибкими
б) рассчитывать на самые худшие сценарии развития ситуации
Не рассчитывайте на работоспособность коммунальных служб
2010 год начался неожиданно бурно, что, впрочем, стало приятной неожиданностью. Похоже, есть шанс, что в этом году наша страна не будет находиться в состоянии затянувшихся каникул до 8 марта, а начнет наверстывать упущенное за прошлый, «кризисный» год.
Мы тоже решили не отставать, и в первом квартале запустили акцию, направленную на то, чтобы те из вас, кто отвечает за непрерывность ИТ-сервисов, начали год с внешнего [инструментального] аудита своих HA/DR решений, чтобы получить дополнительную информацию о том, что необходимо сделать в текущем году, где есть проблемы, о которых вы, возможно, не подозреваете, а где есть возможности для повышения эффектвности, или даже снижения затрат. В качестве инструмента для проведения аудита было выбрано решение RecoverGuard нашего партнера Continuity Software.
А в качестве бонуса тем, кто начнет свой год с повышения отказоустойчивости своей инфраструктуры достанется поездка в Израиль - короткий курс по принципам работы системы в учебном центре Continuity Software в Тель-Авиве, reference visit в одну из компаний-пользователей RecoverGuard, ну и возможность немного отдохнуть и поплавать под ласковым израильским солнцем – март-апрель самое подходящее время для визита в эту страну.
Более подробную информацию о нашей акции можно посмотреть здесь.
Сегодня на российском блоге VMware проскочил вполне доходчивый пост о том, как обеспечить непрерывность работы VMware Virtual Center. Речь идет про продукт VMware vCenter Server Heartbeat, в девичестве – продукт компании NeverFail, о решениях которой я напишу существенно более подробно в течение ближайшей недели-двух. VMware Russia – прошу любить и жаловать
BS25999 по-русски
01.01.2010
С 12 января 2010 года вступают в силу два российских стандарта по непрерывности бизнеса, «идентичные национальным стандартам Великобритании BS 25999-x». Стандарты носят легко запоминающийся номер 53647.x (ГОСТ Р 53647.1 − 2009 «Менеджмент непрерывности бизнеса. Часть 1. Практическое руководство» и ГОСТ Р 53647.2 − 2009 «Менеджмент непрерывности бизнеса. Часть 1. Требования»).
С Новым Годом!
30.12.2009
Вот и подходит к концу 2009 год. Для кого-то он был хороший, для кого-то не очень, кто-то жаловался на кризис, кто-то рапортовал о новых достижениях. В любом случае, все плохое рано или поздно забудется, а все хорошее останется с нами.
На смену старому году приходит новый, и под звон бокалов и другой разбитой на счастье посуды я желаю всем побольше позитива, новых креативных идей и их успешной реализации, счастья в личной жизни.
До встреч в новом году!
BS 25999, операторы связи и консультанты
21.12.2009
В конце ноября первый оператор связи получил сертификат соответствия BS 25999-2:2007. Им стала британская Telefónica O2 UK Ltd, а сертификацию провел BSI – откровенный лидер на этом рынке. Что радует, областью сертификации было выбрано «оказание услуг мобильной связи», т.е. действительно ключевая услуга для оператора.
В тот же день аналогичный сертификат получила и PricewaterhouseCoopers LLP. Здесь примечательно то, что сертифицирован был 41 офис компании в Великобритании, и их перечень занял 6 из 7 страниц сертификата
Органом по сертификации опять же выступил BSI, что, к моему удивлению, не было отражено в пресс-релизе компании.
Даже особенно нечего и добавить – молодцы коллеги, так держать.
Непрерывность бизнеса и комсомольская пресса
06.12.2009
Жизнь учит нас, что ничему не учит… Точнее, учиться на чужих ошибках нам не интересно.
Люди, профессионально занимающиеся непрерывностью бизнеса, могут пропустить этот пост – это из серии «наболело». Постараюсь изложить свои эмоции, не используя профессиональных терминов с одной стороны, и нецензурных выражений с другой.
Три с половиной года назад сгорела редакция Комсомольской правды.
По заявлениям самой КП, «Номер, который уже был готов к подписанию, пришлось переписывать заново, потому что сгорели все серверы и вышли из строя компьютеры. Приютила нас на три дня «Экспресс-газета», которая находилась в соседнем здании. Ущерб от пожара насчитывает около 2 миллионов долларов.»
Сколько из этих двух миллионов пришлось на сгоревшие материальные ценности – я не знаю. Неизвестно также, пытался ли кто-то оценивать безвозвратно потерянную информацию. В любом случае - «Годы работы по созданию одного из крупнейших фотоархивов страны пошли насмарку. В редакции сгорели тысячи дисков с фотографиями за десятки лет. Выгорела ценнейшая библиотека.» [пруфлинк - здесь]
Теперь давайте посмотрим, что произошло на этой неделе с сайтом «Московского комсомольца». По сообщению самого МК, «Неустановленные пока злоумышленники атаковали интернет-сайт нашей газеты. В результате была уничтожена значительная часть информации на mk.ru, и ресурс был некоторое время недоступен для посетителей.[...] Команда сайта работает над восстановлением ресурса в первоначальном виде. К счастью, все тексты публикаций сохранились, однако значительная часть графических- и видеоматериалов была утрачена.»
Несмотря на то, что прямых материальных потерь не было (в смысле, ничего не сгорело, не было украдено и т.п.), по словам главного редактора МК «к сожалению, мы понесли большие финансовые потери, потому что появились большие вопросы с рекламодателями.»
В сухом остатке – безвозвратно погиб архив (или его часть), и на неопределенное время нарушена работоспособность сайта, являющегося, в частности, достаточно крупной рекламной площадкой.
Давайте теперь посмотрим, что общего в этих случаях, и что можно было бы сделать, чтобы избежать столь серьезных последствий.
Типовой план ОНиВД для банков
03.12.2009
Анализируя запросы, по которым читатели попадают на этот блог, я обратил внимание, что достаточно большой процент запросов посвящен поиску типовых планов ОНиВД для банков. Потребность вполне обоснованная – банковская сфера на сегодняшний день единственная в России, где присутствует четкое регулирование в области непрерывности деятельности (Положение Банка России №242-П). При этом, если крупные банки могут себе позволить выделенный персонал и привлечение внешних консультантов для выполнения этой работы, то в средних и малых банках функция ОНиВД как правило дается «в нагрузку» кому-то из уже существующих сотрудников.
Внутри своей компании мы уже обсуждали возможность сделать типовое решение для банков, которое позволит провести анализ воздействия на бизнес, оценку рисков и на основе собранной информации сформировать типовой план ОНиВД. В США такое решение достаточно успешно функционирует – система PlaNET, разработанная SunGard Availability Solutions на основе продуктов LDRPS и BIA Professional с ограниченной функциональностью. Основные ограничения, внесенные в продукт - это невозможность изменения шаблонов планов, опросных листов и т.п. Взамен этого заказчик получает встроенную в продукт методологию проведения анализа воздействия на бизнес, оценки рисков и типовые планы, учитывающие специфику банковской деятельности.
Со своей стороны, мы (Алмитек) готовы сделать типовое решение по созданию планов ОНиВД на движке Continuity Management Solution, включающем в себя BIA Professional, Risc Assessment и LDRPS. Но для того, чтобы этот проект был успешен, нам необходимо две вещи:
- Реальный интерес к продукту со стороны рынка, подтвержденный готовностью платить за такой сервис сумму порядка 30 тыс. рублей в месяц;
- Несколько банков, которые согласятся выступить первыми пользователями решения, и примут участие в опытной эксплуатации продукта. Взамен эти банки получат более выгодные условия предоставления данного сервиса.
Если вы представляете банк, которому может быть интересно либо использовать готовый сервис, либо принять участие в его создании, я буду признателен за короткое письмо на адрес bcp@almitech.ru, в котором вы обозначите ваш интерес к решению.

