Интервью TAdviser с председателем правления Банка «Югра» Дмитрием Шиляевым
Технический сбой в работе Банка «Югра» заставил поволноваться вкладчиков: в течение двух дней были проблемы с выполнением банковских операций. Что стало причиной этого инцидента, кто виноват и какие меры принимаются, чтобы подобное не повторилось, в интервью TAdviser рассказал председатель правления Банка «Югра» Дмитрий Шиляев.
Сбой, который произошел в конце апреля, это что-то экстраординарное для банка? Были ли такие инциденты раньше?
Дмитрий Шиляев: Нет, ничего подобного до этого не было. Сбой возник из-за того, что подряд отказали два основополагающих узла - источник бесперебойного питания и система хранения данных. При нарушении в подаче электричества источник бесперебойного питания не переключился на батареи, а система хранения данных потеряла свою конфигурацию.
СХД по определению, по своим заявленным вендором характеристикам, является энергонезависимой. При отключении питания она, согласно описанию, обладает достаточными возможностями для сброса данных из кэша, в том числе конфигурации, на жесткий диск. Почему этого не произошло, ответа пока нет. Как и на то, почему бесперебойник не переключился на батарею. И система, и бесперебойник у нас от одного поставщика – IBM.
И что произошло из-за отказа оборудования?
Дмитрий Шиляев: Мы потеряли доступ к СХД, важную часть основной инфраструктуры. Угрозы потери данных клиентов при этом не было, однако функционировать СХД не могла, соответственно, не работали установленные на ней виртуальные машины. Еще раз хочу отметить, сами данные по клиентам не были затронуты.
Восстановление серверов, с помощью которых мы осуществляли доступ к данным, заняло полдня, с 13:42 25 апреля, когда произошел сбой, до 2 часов ночи 26 апреля. Восстановление СХД заняло больше времени, оно осуществлялось инженерами IBM. По их предварительному отчету, возникло «прерывание работоспособности после сбоя в сети электропитания».
Сколько дней длились проблемы?
Дмитрий Шиляев: Полное прерывание работоспособности длилось 12 часов примерно. Затем доступ к данным был восстановлен, но имевшиеся серверные ресурсы были не в том объеме, который позволил бы подключиться к системе всем операционистам, поэтому офисы работали 26 апреля в ограниченном режиме.
В четверг 27 апреля функционировало уже 95% всей мощности, в целом мы обеспечивали полное обслуживание всех клиентов.
Какие выводы были сделаны из случившегося?
Дмитрий Шиляев: Основной вывод - нужно территориально разносить центры обработки данных. У нас основной и резервный ЦОДы были размещены на одной территории. ЦОДы собственной постройки, мы лишь арендуем помещение. Нареканий к ним до этого не было.
Сейчас мы строим третий дополнительный ЦОД на другой площадке.
А были идеи использовать аутсорсинговый ЦОД?
Дмитрий Шиляев: Мы рассматривали вопрос аутсорсинга, аренду стоек, но не приняли такого решения - риски слишком серьезные.
Необходимо сделать дополнительные ЦОДы и разнести их территориально. Несколько лет назад мы даже рассматривали вариант размещения ЦОДов в разных городах с периодическим очередным переключением работы на каждый из них. Но не реализовали проект, потому что он оказался довольно затратным. Возможно, мы к этому обсуждению вернемся, но позже. Сейчас остановились на том, что на другой территории в Москве мы делаем еще один резервный ЦОД.
Требования ЦБ регламентируют, на каком расстоянии должены быть резервные ЦОДы?
Дмитрий Шиляев: Нет, там есть только требования о необходимости резервирования. В момент технического сбоя ЦБ тоже проявили озабоченность, приезжали сотрудники, которые участвовали в наших совещаниях.
Москва - это же дорогой город?
Дмитрий Шиляев: Понятно, что в Оренбурге или, например, Обнинске строить ЦОД будет дешевле, но основной вопрос остается в кадрах. Так как банк достаточно динамично развивается, то ЦОД должен развиваться вслед за банком - наращивать свои мощности, переходить на новую платформу и т.д., а это все требует внимания персонала и его развития. Этот вопрос заставляет концентрироваться на Москве.
Как вы оцениваете действия ИТ-персонала банка в момент критической ситуации?
Дмитрий Шиляев: В целом профессионально. Претензий со стороны IBM, замечаний по обслуживанию оборудования и обновлениям нет. Более того, микрокод мы обновили буквально за несколько дней до события. Аналогичная ситуация по бесперебойнику – мы вызвали сервисную компанию, у нее также не оказалось претензий к эксплуатации - оборудование у нас в настоящее время в идеальных условиях. Вся техника новая, была закуплена в середине 2015 года и до сих пор находится на гарантии.
В новом ЦОДе тоже планируете использовать IBM? Или, может быть, например, HP для подстраховки?
Дмитрий Шиляев: К HP тоже есть свои требования. Я лично считаю, что IBM - это все-таки другой уровень. Обычно HP - это АБС, IBM - это процессинг, потому что процессинг - это 24/7 с минимальным временем возможного простоя и минимальным временем обслуживания. К тому же мы сильно завязаны на IBM: по этому оборудованию есть компетенции, и наша инфраструктура сильно связана. Я имею в виду системы синхронизации СХД, системы виртуализации. У нас не только x86, но и Power процессоры с операционной системой AIX, встроенные системы виртуализации и так далее. Интеграция достаточно тесная.
У банка существует ИТ-стратегия? Каковы ее приоритеты?
Дмитрий Шиляев: Конечно, ИТ-стратегия существует, в ее основе - поддержка развития розничного бизнеса, повышение отказоустойчивости. Поддержка розницы – это, прежде всего, дистанционные каналы банковского обслуживания, развитие интернет-банка, карточного бизнеса. А также развитие сайта банка, мобильных приложений и множества других сервисов.
А в целом, как вы видите дальнейшее развитие банковской сферы?
Дмитрий Шиляев: Мы немного консерваторы в этом смысле. Есть финтехи, есть динамичные стартапы, но банк – это, в первую очередь, надежность. Банк берет на себя чужие риски, и в этой парадигме он должен обеспечить надежный тыл и фундамент.
Сейчас существует определенный тренд - открытый интерфейс. Банк является своего рода сейфом, интерфейс к которому может строить бесконечное количество финтех-компаний. Своеобразный «мидл офис» - то, что просчитывает риски и определяет стоимость рисков. Фактически данный подход позволяет банку не тратить время и ресурсы на угадывание сиюминутных желаний клиентов и выполнять свою основную функцию, а с другой стороны – присутствовать практически везде. Второй тренд - это маркетплейс. Используя свою сеть офисов, банк может помогать продавать смежные продукты.