Вчера (1 июля)  прошел круглый стол CNews, посвященный вопросам непрерывности бизнеса. Мероприятие получилось удачное, организаторы, несмотря на лето, собрали хорошую представительную аудиторию.

На этот раз мне понравилось подавляющее большинство докладов. Хорошо и по делу выступил Николай Пучков из Сити Банка с рассказом о том, как строить оптимальную стратегию непрерывности бизнеса. Виктория Голубева из МегаФона системно прошлась по рискам, связанным с непрерывностью бизнеса.

Очень ярким и запоминающимся получился доклад Антона Жбанкова, человека, широко известного в мире виртуализации, который прошелся по основным «достоинствам» облачных технологий, немного приземлив их на грешную землю :)

Я в своем докладе постарался  сфокусироваться на основных способах повышения эффективности системы обеспечения непрерывности бизнеса, и вот, что получилось.

Спасибо всем участникам и организаторам за отличное мероприятие!

22 апреля в 15:00 состоится Вебинар, посвященный типичным ошибкам и проблемам, возникающим в решениях обеспечения высокой доступности и аварийного восстановления (HA/DR), как с ними бороться, и как в этом может помочь RecoverGuard от Continuity Software.

Вебинар на русском, бесплатно, докладчик – я :)

Регистрация на Вебинар здесь.

4 марта CTO компании Continuity Software, Doron Pinhas, предлагает вашему вниманию Вебинар «Downtime Avoidance – Datacenter Management Series«.

В программе Вебинара:

  • Почему простои случаются даже при использовании наиболее передового ПО обеспечения высокой доступности;
  • Какие уязвимости конфигураций встречаются наиболее часто, и как они могут влиять на нормальный ход деятельности;
  • Как переход от периодического тестирования HA-решений к постоянной, автоматизированной верификации конфигураций может повысить показатели восстановления и снизить затраты.

Вебинар пройдет в абсолютно комфортное время – 22:00 по Москве, когда никакие рабочие дела не помешают вам насладиться общением с Дороном :)

Ссылка для регистрации тут.

Начало 2010 ознаменовалось для компании Continuity Software сразу двумя важными событиями.

Практически одновременно с этим на рынок была выпущена новая версия - RecoverGuard 5.0, о возможностях которой я расскажу поподробнее.

2010 год начался неожиданно бурно, что, впрочем, стало приятной неожиданностью. Похоже, есть шанс, что в этом году наша страна не будет находиться в состоянии затянувшихся каникул до 8 марта, а начнет наверстывать упущенное за прошлый, «кризисный» год.

Мы тоже решили не отставать, и в первом квартале запустили акцию, направленную на то, чтобы те из вас, кто отвечает за непрерывность ИТ-сервисов, начали год с внешнего [инструментального] аудита своих HA/DR решений, чтобы получить дополнительную информацию о том, что необходимо сделать в текущем году, где есть проблемы, о которых вы, возможно, не подозреваете, а где есть возможности для повышения эффектвности, или даже снижения затрат. В качестве инструмента для проведения аудита было выбрано решение RecoverGuard нашего партнера Continuity Software.

А в качестве бонуса тем, кто начнет свой год с повышения отказоустойчивости своей инфраструктуры достанется поездка в Израиль - короткий курс по принципам работы системы в учебном центре Continuity Software в Тель-Авиве, reference visit в одну из компаний-пользователей RecoverGuard, ну и возможность немного отдохнуть и поплавать под ласковым израильским солнцем – март-апрель самое подходящее время для визита в эту страну.

Более подробную информацию о нашей акции можно посмотреть здесь.

В Storage News №3 (40) за 2009 год вышла  моя статья про управление непрерывностью ИТ-сервисов. Точнее говоря, про проблемы, возникающие при эксплуатации HA/DR решений в изменяющейся среде, и про то, как с ними (проблемами) бороться.

С 21 по 27 октября мы совместно с Continuity Software проводим Road Show, представляя потенциальным потребителям продукт RecoverGuard™, которому уже было посвящено несколько предыдущих постов.  Первые три дня (21-23 октября) мы с Гилом (Gil Hecht, CEO Continuity Software) проведем в Алматы, после чего вернемся в Москву, где и продолжим общение с российскими компаниями до 27 октября.

Если у вас есть желание встретиться с нами в эти дни – пишите, постараемся найти время в нашем графике.

Итак, первый день завершился :)

Прошел круглый стол по вопросам непрерывности бизнеса. Что порадовало – зал был практически полон, что  говорит об интересе аудитории к данной тематике.

Моя презентация по вопросам тестирования системы обеспечения непрерывности бизнеса – здесь.

 После этого на презентационной площадке прочитал презентацию про RecoverGuard, о котором уже писал раньше. Презентационная площадка оказалась расположенной в крайне неудобном месте, найти которое оказалось не очень просто :(   Тем не менее, презентация состоялась, а те кто, не нашел площадку, или не был сегодня на InfoSecurity, могут посмотреть ее здесь.

Меньше месяца осталось до самого крупного мероприятия в области информационной безопасности – InfoSecurity. По складывающейся традиции, не осталась в стороне и тема непрерывности бизнеса.

В первый день (29 сентября), предваряя процедуру официального открытия выставки, с 12:15 до 13:45 пройдет секция «Построение и сохранение непрерывности бизнеса в существующих условиях. Информационная безопасность, как один из элементов непрерывности?» под чутким руководством Димы Кострова из МТС. Как водится, точный состав выступающих и темы выступлений будут еще утрясаться, за себя могу сказать, что говорить буду про тестирование – как лучше проводить тестирование/учения так, чтобы потом не было мучительно больно :) .

Кроме того, в тот же день сразу после официального открытия, в 14:30 на презентационной площадке расскажем про решение RecoverGuard от Continuity Software, о котором я писал в предыдущем посте.

Будет еще выступление про безопасность в виртуальных средах (на Круглом столе у Емельянникова, в 15:30 30 сентября)  , и битва во имя решения Reflex VMC на Львах и Гладиаторах (1 октября в 12:15), но это уже отдельная тема, к данному блогу не относящаяся.

Так что всем добро пожаловать :)

Задача тестирования HA/DR решений всегда являлась для ИТ-персонала определенной головной болью.

Все сознают, что тестировать надо (не встречал еще ни одного человека, который сказал бы, что тестирование – это зло). Но, когда дело доходит до конкретных действий, креативу на тему «почему мы не можем делать это сейчас» зачастую можно только позавидовать. Среди аргументов присутствует как абсолютно разумное опасение «положить» рабочую систему, так и заявления в духе «все и так будет работать».

Как показывает опыт – само по себе с первого раза практически никогда не заработает, а вот рабочую систему положить можно запросто :) Особенно если взять, и сразу попробовать протестировать комплексное восстановление.

К чему я все это рассказываю? Несколько месяцев назад нам на глаза попалась компания Continuity Software, и на днях мы подписали с ними партнерское соглашение. Продукт у них всего один – RecoverGuard, зато интересный. Задача, которую помогает решить RecoverGuard - убедиться в  том, что ваши HA/DR решения работают. Простая, но нужная. Безусловно, использование RecoverGuard – не замена «боевому» тестированию – но возможность существенно снизить риски сбоев в момент тестирования, а также поддерживать систему в работоспособном состоянии в промежутке между тестированиями.

Давайте посмотрим, что стоит за этими словами.

1. Некорректные конфигурации. RecoverGuard содержит постоянно обновляемую (как инженерами Continuity Software, так и пользователями системы) базу знаний о существующих уязвимостях в архитектуре HA/DR решений от различных производителей. Соответственно, наличие (а точнее, отсутствие) подобных уязвимостей RecoverGuard проверяет в первую очередь. Примерно аналогично проверяется соответствие лучшим практикам, рекомендованным производителями.

2. Расхождение конфигураций. Очень распространенная проблема, когда при внесении изменений (от применения обновлений до апгрейда железа) в продуктивную систему, в резервную систему изменения не вносятся, или вносятся, но не такие. Такого рода расхождения (т.н. configuration drift) RecoverGuard также достаточно легко обнаруживает.

Это две основные функции, которые позволяют предотвратить массу серьезных проблем.

Кроме того, в продукте реализована еще масса приятных возможностей:

  • Оценка выполнимости SLA на основе анализа конфигурации решений
  • Документирование инфраструктуры
  • Механизм alert’ов
  • И т.п.

Для того, чтобы убедиться в полезности продукта, Continuity Software (а в России и СНГ – вместе с Алмитек) предлагает сделать короткий пилот. Устанавливается система, выдаются права на доступ к элементам инфраструктуры (агентов ставить никуда не надо, достаточно только прав на чтение), в течение суток проводится анализ, на основании чего делается отчет. Пилот платный, но и результат полезный в любом случае – текущий срез уязвимостей заказчик получает вне зависимости от того, будет ли решение использоваться в дальнейшем. По утверждению производителя – проблемы обнаруживаются всегда.