2016/08/26 13:41:21

Алексей Малафеев, ТГК-1: Катастрофоустойчивый ЦОД на базе двух дата-центров должен работать как единое целое

В интервью TAdviser о реализации катастрофоустойчивого решения для корпоративного дата-центра рассказал Алексей Малафеев, директор Предприятия средств диспетчерского и технологического управления и информационных технологий филиала «Невский» ОАО «ТГК-1».

Алексей
Малафеев
Катастрофоустойчивый ЦОД на базе двух дата-центров должен работать как единое целое

Какое решение для ЦОД можно считать идеально катастрофоустойчивым с учетом специфики производственной деятельности компании ТГК-1?

Алексей Малафеев: Любое катастрофоустойчивое решение, независимо от специфики деятельности компании, предполагает, как минимум два географически разнесенных дата-центра. И работать эти ЦОД должны как единое целое, то есть автоматически балансировать нагрузку. Соответственно, если один из дата-центров вдруг перестает работать, второй должен иметь достаточную мощность, чтобы обеспечить работоспособность системы в целом. В плане расстояния между ЦОД для обеспечения такого режима работы есть ограничение – не больше 100 км.

Расскажите, пожалуйста, коротко о предыстории проекта – когда руководством была поставлена задача о необходимости построения именно катастрофоустойчивого ЦОД? В связи с чем возникла такая необходимость?

Алексей Малафеев: Руководством такая задача напрямую не ставилась, необходимость возникла естественным образом. Первоначально серверная находилась в головном офисе, в историческом центре города. В определенный момент стали возникать проблемы со снабжением электроэнергией, достаточности места, а затем был запланирован переезд в новый офис. И было принято решение, что лучше сделать два менее защищенных ЦОД, чем построить один, пусть даже и сверхнадежный.

Что было сделано в рамках его реализации?

Алексей Малафеев: В связи со спецификой деятельности ТГК-1, мы обладаем собственными оптическими кабелями, которые проложены между всеми нашими объектами. Для реализации проекта мы выбрали две крайних по географическому положению станции – на севере и на юге города. Оптика была переключена таким образом, чтобы между этими двумя объектами появились прямые каналы связи. Это первое, что было сделано. И второй момент, позволивший построить именно катастрофоустойчивый ЦОД, – это внедрение системы EMC VPLEX.

Что это за решение? Почему выбор был остановлен именно на EMC VPLEX? Какой продукт заменила?

Алексей Малафеев: EMC VPLEX - это виртуализатор СХД, позволяющий одновременно считывать и записывать данные в географически разнесенных дата-центрах. До этого у нас работала аналогичная система от HP, но, во-первых, она перестала устраивать по производительности и надежности, а во-вторых, вендор решил свернуть поддержку и развитие данного продукта. Выбор в пользу решения EMC был сделан в силу уникальности системы. Достойного конкурента, на мой взгляд, у него на рынке нет. В плане функционала данное решение позволяет работать с большим количеством достаточно дешевых дисковых массивов, позволяя предоставлять одинаковые вычислительные мощности на базе обоих дата-центров. Это и позволяет реализовать автоматическую балансировку нагрузки.

Какое место занимает данное аппаратное решение в ИТ-ландшафте катастрофоустойчивого решения? С каким оборудованием интегрировано?

Алексей Малафеев: Вся дисковая емкость обоих ЦОД доступна именно через EMC VPLEX. Соответственно, все сервера видят диски исключительно через данную систему. В обоих дата-центрах осуществляется постоянное, в режиме реального времени поддержание в актуальном состоянии аналогичных дисковых массивов. Решение EMC VPLEX именно этим и занимается.

Выделяются ли в системе основной дата-центр и резервный? Мощность каждого из них?

Алексей Малафеев: Мы прошли достаточно долгий путь эволюции, в итоге отказавшись от концепции «основной ЦОД – резервный ЦОД». Оба дата-центра равноправны, оснащены практически одинаковым набором оборудования, одинаково сконфигурированного и даже расположенного в помещении примерно в одних и тех же местах. Соответственно, ЦОДы имеют примерно одинаковые мощностные характеристики.

На какое расстояние разнесены основной и резервный центры?

Алексей Малафеев: Чисто географически, как я уже говорил, объекты разнесены на противоположные концы города, километраж точно не могу указать. Важнее другой параметр - длина оптического волокна между дата-центрами. Сегодня она составляет порядка 50 км (первоначально была порядка 70).

Помогала ли компания EMC своей экспертизой/специалистами на этапе реализации проекта, или она была только поставщиком оборудования?

Алексей Малафеев: Когда система запускалась в промышленную эксплуатацию, это был первый в России проект такого масштаба. Поэтому, естественно, специалисты EMC активно участвовали в реализации данного проекта. Проблем с интеграцией не возникало. Более того, EMC VPLEX, как оказалось, прекрасно интегрировалась даже с массивами, которые официально данное решение не поддерживает. Наши специалисты учились по ходу дела, непосредственно в процессе реализации проекта и на данный момент поддержка системы осуществляется силами собственного ИТ-подразделения ТГК-1. EMC VPLEX серьезно развивается на программном уровне, постоянно приходят обновления. В этом году мы ожидаем релиза нового, более мощного аппаратного решения, которое и планируем у себя поставить уже в этом году.

Каким образом будет осуществляться замена аппаратного обеспечения? Ведь система находится в промышленной эксплуатации…

Алексей Малафеев: Дата-центры сконфигурированы таким образом, что замену любого оборудования можно выполнять в любое время без ущерба для операционной работы.

Как Вы относитесь к сертификации ЦОД по международным стандартам Tier?

Алексей Малафеев: Вся эта история с сертификацией дата-центра на соответствие международным стандартам достаточно условна, на мой взгляд, и в нашем случае сертификация вряд ли требуется. С одной стороны, мы располагаем маленькими дата-центрами, расположенными не в отдельных зданиях, и у нас не имеется специальных дизель-генераторов. Но с другой стороны, они нам и не нужны, поскольку в силу специфики деятельности компании ЦОД находятся непосредственно на объекте для генерации энергии. Более того – объекты компании объединены в энергетическое кольцо, и в случае отключения одного из объектов, энергия придет с другого. Таким образом, по формальным признакам мы вряд ли прошли бы сертификацию, но фактически уровень надежности очень высокий. А от человеческого фактора никто не застрахован.

Есть ли у Вас как у специалиста свой взгляд на российский рынок коммерческих ЦОДов?

Алексей Малафеев: Мы сами уже фактически начинаем работать на этом рынке. При этом мы не сдаем в аренду площади под размещение стоек, но на коммерческой основе оказываем смежным организациям услуги по предоставлению пула виртуальных вычислительных ресурсов. Таким образом, мы сами понемногу становимся коммерческим дата-центром. В целом по рынку, на мой взгляд, аренда вычислительных мощностей у коммерческих дата-центров интересна маленьким компаниям, которым для работы требуется порядка нескольких десятков серверов.

30