Суперкомпьютер в 10000 ядер собран в «облаке» Amazon
07.04.11, Чт, 15:58, Мск,
Сверхмощный кластер на платформе ОС Linux из 10 тыс. ядер, размещенный в «облаке» Amazon, оказался способен осуществлять расчеты белковых связей, которые в обычных условиях длятся по несколько недель и месяцев. Компания-интегратор не собирается останавливаться на достигнутом.
Джейсон Стоу (Jason Stowe), эксперт по высокопроизводительным вычислительным системам, недавно задал двум своим инженерам простой вопрос: можно ли построить 10000-ядерный кластер в «облаке»?
Это действительно хорошее круглое число, сказал Стоу, генеральный директор и основатель компании Cycle Computing, которая помогает клиентам в получении быстрого и эффективного доступа к вычислительным мощностям вроде суперкомпьютеров, которые обычно зарезервированы для университетов и крупных исследовательских организаций.
Cycle Computing уже создала несколько кластеров в облаке Elastic Compute Cloud компании Amazon, которое масштабируется до нескольких тысяч ядер. Но Стоу хотел вывести его на следующий уровень. Создание резерва в 10000 ядер на Amazon, вероятно, делалось неоднократно, но Стоу о таких достижениях неизвестно, подразумевая, что применяется пакет технологического планирования и запуска приложений, оптимизированных для работы на высокопроизводительных компьютерах (HPC).
Стоу говорит, что найти ссылки на нечто большее им не удалось. Если бы система была протестирована на скорость, то его Linux-кластер, запущенный на Amazon, возможно, был бы достаточно крупным, чтобы войти в список пятисот самых высокопроизводительных суперкомпьютеров мира. Но прежде всего, требовалось найти клиентов, которые выиграют от использования такого большого кластера. Нет смысла раскручивать такую большую вычислительную среду, если она не предназначена для реальной работы.
Клиентом, который выбрал 10 000-ядерный «облачный» кластер, стала компания биотехнологий Genentech (Сан-Франциско), где ученому Якобу Корну (Jacob Corn) требовались вычислительные мощности для изучения белковых связей. Как DevOps-сервис помогает «разгрузить» высоконагруженные системы BPMSoft
Опираясь на рекомендации Amazon в оптимальности времени для запроса 10 000 ядер, Cycle Computing и Genentech раскрутили кластер 1 марта сразу после полуночи. Хотя Amazon предлагала виртуальные машины, оптимизированные для высокопроизводительных вычислений, Cycle и Genentech выбрали Linux кластер «standard vanilla CentOS», чтобы сэкономить деньги, по совету Стоу. CentOS - версия Linux на основе Linux Red Hat.
10 000 ядер были составлены из 1250 машин с восемью ядрами каждая, а также 8,75 Терабайт ОЗУ и 2 Петабайт дискового пространства. Увеличиваясь до нескольких тысяч ядер за раз, процесс занял 45 минут, прежде чем кластер был собран целиком. Все прошло без проблем. «Когда мы запросили 10000-е ядро, мы его получили», сказал Стоу.
Кластер отработал восемь часов при стоимости $8500, включая все виды платежей.
Для Genentech это стало дешевле и проще по сравнению с альтернативой покупки 10 000 ядер для своего центра данных, и оплаты их простоя на протяжении большей части своей жизни, сказал Корн. По его мнению, использование существующих ресурсов для выполнения моделирования могло бы занять несколько недель или месяцев вместо восьми часов, которые потребовались на Amazon. Genentech выгадала от использования большого числа ядер потому что эти расчеты «ошеломляюще параллельны», без каких-либо связей между узлами, в результате чего производительность становится «масштабируемой линейно с увеличением числа ядер», сказал исследователь.
Стоу заметил, что компания уже работает над большим расширением. Все, в чем нуждается Cycle - клиент, который сможет воспользоваться этими возможностями.