Nvidia H100 GPU

Продукт

Разработчики:	Nvidia (Нвидиа)
Дата премьеры системы:	2022/03/25
Отрасли:	Электротехника и микроэлектроника
Технологии:	Процессоры

Основные статьи:

2022: Анонс кремниевой архитектуры Hopper и созданной на её основе GPU H100

25 марта 2022 года компания NVidia анонсировала целый ряд технологий, ориентированных на использование в сфере искусственного интеллекта. В первую очередь, это кремниевая архитектура Hopper, созданный на её основе GPU H100 и «суперпроцессор» Grace CPU.

Nvidia H100 GPU

По информации компании, архитектура и суперпроцессор названы в честь контр-адмирала ВМФ США Грейс Хоппер (Grace Hopper), создательницы первого в истории компилятора компьютерного языка программирования и одного из первых высокоуровневых языков программирования COBOL.

Архитектура Hopper и GPU H100 призваны оптимизировать процесс обучения машинных моделей. Шина NVLink четвёртого поколения позволяет соединять до 256 GPU H100, обеспечивая девятикратный прирост пропускной способности, по сравнению с предыдущими поколениями.Дмитрий Пенязь, OpenYard: Мы живем во времена бэби-бума на российском ИТ-рынке 6 т

Сам по себе процессор H100 содержит 80 млрд транзисторов. При этом он поддерживает PCIe Gen5 и HBM3; благодаря этому пропускная способность памяти достигает 3 терабайт в секунду. В Nvidia утверждают, что H100 в три-шесть раз превосходит процессор предыдущего поколения A100 в вычислениях с плавающей запятой в зависимости от разрядности.

В зависимости от форм-фактора характеристики GPU будут несколько отличаться. Так, у старшей версии имеется 15 872 ядра CUDA.

Технические характеристики

Памяти у обеих версий по 80 ГБ, причём это HBM3 с пропускной способностью 2 либо 3 ТБ/с. TDP старшей версии составляет 700 Вт, тогда как у модификации с PCIe 5.0 показатель вдвое меньше.

Производительность версии SXM5 достигает 30 TFLOPS (FP64), 60 TFLOPS (FP32), а у версии PCIe 5.0 показатели соответственно равны 24 и 48 TFLOPS. Также стоит отметить интерфейс NVLink, который в том же порядке обеспечивает скорость передачи данных в 900 либо 600 ГБ/с.

Что касается Grace CPU, то это фактически два процессора, соединённых шиной NVLink-C2C. Grace предназначен для использования в «гипермасштабных высокопроизводительных вычислениях и сфере ИИ» в комплекте с H100 или самостоятельно. Процессор насчитывает 144 ядер Arm, а его пропускная способность составляет 1 терабайт в секунду^[1].

Архитектура Hopper приносит на рынок и тензорные ядра четвёртого поколения, которые в девять раз быстрее предыдущего поколения в ряде задач машинного обучения. Отдельно в Nvidia отметили набор инструкций DPX, который поможет разработчикам писать код для ускорения алгоритмов динамического программирования в различных отраслях, ускоряя рабочие процессы для диагностики заболеваний, квантового моделирования, анализа графов и оптимизации маршрутизации.

Системы на основе решений Hopper будут доступны партнёрам Nvidia в третьем квартале^[2].