Разработчики: | Nvidia (Нвидиа) |
Дата премьеры системы: | 2022/03/25 |
Отрасли: | Электротехника и микроэлектроника |
Технологии: | Процессоры |
Основные статьи:
2022: Анонс кремниевой архитектуры Hopper и созданной на её основе GPU H100
25 марта 2022 года компания NVidia анонсировала целый ряд технологий, ориентированных на использование в сфере искусственного интеллекта. В первую очередь, это кремниевая архитектура Hopper, созданный на её основе GPU H100 и «суперпроцессор» Grace CPU.
По информации компании, архитектура и суперпроцессор названы в честь контр-адмирала ВМФ США Грейс Хоппер (Grace Hopper), создательницы первого в истории компилятора компьютерного языка программирования и одного из первых высокоуровневых языков программирования COBOL.
Архитектура Hopper и GPU H100 призваны оптимизировать процесс обучения машинных моделей. Шина NVLink четвёртого поколения позволяет соединять до 256 GPU H100, обеспечивая девятикратный прирост пропускной способности, по сравнению с предыдущими поколениями.Дмитрий Пенязь, OpenYard: Мы живем во времена бэби-бума на российском ИТ-рынке
Сам по себе процессор H100 содержит 80 млрд транзисторов. При этом он поддерживает PCIe Gen5 и HBM3; благодаря этому пропускная способность памяти достигает 3 терабайт в секунду. В Nvidia утверждают, что H100 в три-шесть раз превосходит процессор предыдущего поколения A100 в вычислениях с плавающей запятой в зависимости от разрядности.
В зависимости от форм-фактора характеристики GPU будут несколько отличаться. Так, у старшей версии имеется 15 872 ядра CUDA.
Памяти у обеих версий по 80 ГБ, причём это HBM3 с пропускной способностью 2 либо 3 ТБ/с. TDP старшей версии составляет 700 Вт, тогда как у модификации с PCIe 5.0 показатель вдвое меньше.
Производительность версии SXM5 достигает 30 TFLOPS (FP64), 60 TFLOPS (FP32), а у версии PCIe 5.0 показатели соответственно равны 24 и 48 TFLOPS. Также стоит отметить интерфейс NVLink, который в том же порядке обеспечивает скорость передачи данных в 900 либо 600 ГБ/с.
Что касается Grace CPU, то это фактически два процессора, соединённых шиной NVLink-C2C. Grace предназначен для использования в «гипермасштабных высокопроизводительных вычислениях и сфере ИИ» в комплекте с H100 или самостоятельно. Процессор насчитывает 144 ядер Arm, а его пропускная способность составляет 1 терабайт в секунду[1].
Архитектура Hopper приносит на рынок и тензорные ядра четвёртого поколения, которые в девять раз быстрее предыдущего поколения в ряде задач машинного обучения. Отдельно в Nvidia отметили набор инструкций DPX, который поможет разработчикам писать код для ускорения алгоритмов динамического программирования в различных отраслях, ускоряя рабочие процессы для диагностики заболеваний, квантового моделирования, анализа графов и оптимизации маршрутизации.
Системы на основе решений Hopper будут доступны партнёрам Nvidia в третьем квартале[2].
Примечания
Подрядчики-лидеры по количеству проектов
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
Данные не найдены
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
Данные не найдены
Распределение систем по количеству проектов, не включая партнерские решения
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)