Разработчики: | Nvidia (Нвидиа) |
Дата премьеры системы: | 2017/05/11 |
Технологии: | Процессоры |
Содержание |
Volta – архитектура GPU.
Процессор на платформе Volta – GPU для дата-центров Tesla V100 обеспечивает высокую скорость и масштабируемость обучения и вывода данных нейронных сетей, ускоряет производительные и графические вычисления.
Каждый GPU Nvidia V100 включает 21 млрд транзисторов (обеспечивающих производительность задачах в глубокого обучения, эквивалентную 100 CPU), 640 Tensor-ядер, технологию NVLink и DRAM 900ГБ/с HBM2, что обеспечивает 50%-ый прирост производительности по сравнению с GPU предыдущего поколения. Пиковая производительность Volta в пять раз выше архитектуры Pascal - действующей графической архитектуры NVIDIA, и в 15 раз выше Maxwell.
GPU V100 идут в комплекте с оптимизированным под Volta программным обеспечением, включая CUDA 9.0 и SDK для глубокого обучения, в который входят TensorRT 3, DeepStream SDK и cuDNN 7, а также все основные ИИ-фреймворки. По информации Nvidia, доступны сотни тысяч GPU-ускоренных приложений для различных тяжелых задач, включая обучение нейросетей и инференс, высокопроизводительные вычисления, графику и сложных анализ данных.
Таблица результатов производительности Tesla V100 в сравнении с ускорителями Tesla предыдущего поколения.
Tesla Product | Tesla K40 | Tesla M40 | Tesla P100 | Tesla V100 |
---|---|---|---|---|
GPU | GK110 (Kepler) | GM200 (Maxwell) | GP100 (Pascal) | GV100 (Volta) |
SMs | 15 | 24 | 56 | 80 |
TPCs | 15 | 24 | 28 | 40 |
FP32 Cores / SM | 192 | 128 | 64 | 64 |
FP32 Cores / GPU | 2880 | 3072 | 3584 | 5120 |
FP64 Cores / SM | 64 | 4 | 32 | 32 |
FP64 Cores / GPU | 960 | 96 | 1792 | 2560 |
Tensor Cores / SM | NA | NA | NA | 8 |
Tensor Cores / GPU | NA | NA | NA | 640 |
GPU Boost Clock | 810/875 MHz | 1114 MHz | 1480 MHz | 1455 MHz |
Peak FP32 TFLOP/s* | 5.04 | 6.8 | 10.6 | 15 |
Peak FP64 TFLOP/s* | 1.68 | 2.1 | 5.3 | 7.5 |
Peak Tensor Core TFLOP/s* | NA | NA | NA | 120 |
Texture Units | 240 | 192 | 224 | 320 |
Memory Interface | 384-bit GDDR5 | 384-bit GDDR5 | 4096-bit HBM2 | 4096-bit HBM2 |
Memory Size | Up to 12 GB | Up to 24 GB | 16 GB | 16 GB |
L2 Cache Size | 1536 KB | 3072 KB | 4096 KB | 6144 KB |
Shared Memory Size / SM | 16 KB/32 KB/48 KB | 96 KB | 64 KB | Configurable up to 96 KB |
Register File Size / SM | 256 KB | 256 KB | 256 KB | 256KB |
Register File Size / GPU | 3840 KB | 6144 KB | 14336 KB | 20480 KB |
TDP | 235 Watts | 250 Watts | 300 Watts | 300 Watts |
Transistors | 7.1 billion | 8 billion | 15.3 billion | 21.1 billion |
GPU Die Size | 551 mm² | 601 mm² | 610 mm² | 815 mm² |
Manufacturing Process | 28 nm | 28 nm | 16 nm FinFET+ | 12 nm FFN |
2017
Решения партнеров на базе Nvidia Volta для ИИ
Nvidia и партнеры компании Dell EMC, Hewlett Packard Enterprise, IBM и Supermicro 28 сентября 2017 года представили более десятка серверов на базе GPU-ускорителей Tesla V100 с архитектурой Nvidia Volta. Мультипроцессорные системы вендоров на базе V100 откроют пользователям широкие возможности GPU Nvidia для ускорения исследований в области ИИ и создания продуктов и услуг в этой области.
Как указали в Nvidia, графические процессоры Nvidia V100, производительность которых в задачах глубокого обучения превышает 120 терафлопс, созданы специально для глубокого обучения нейросетей и инференса, высокопроизводительных вычислений, ускорения аналитики и других ресурсоемких вычислительных задач. Один GPU Volta обеспечивает производительность, эквивалентную 100 CPU, позволяя ученым, исследователям и инженерам решать задачи, решение которых ранее представлялось слишком сложным или невозможным.Российский рынок цифровизации телекома: ключевые тренды и ИТ-поставщики. Обзор TAdviser
Анонсированы следующие системы на базе V100:
- Dell EMC — PowerEdge R740 с поддержкой до трех GPU V100 для PCIe, PowerEdge R740XD с поддержкой до трех GPU V100 для PCIe и PowerEdge C4130 с поддержкой до четырех V100 для PCIe или четырех GPU V100 для Nvidia NVLink в форм-факторе SXM2;
- HPE — HPE Apollo 6500 с поддержкой до восьми GPU V100 для PCIe и HPE ProLiant DL380 с поддержкой до трех GPU V100 для PCIe;
- IBM — серверы следующего поколения IBM Power Systems на базе процессора Power9 с поддержкой нескольких GPU V100 и технологией NVLink с супербыстрым интерконнектом GPU-to-GPU и CPU-to-GPU OpenPOWER для быстрой передачи данных;
- Supermicro — линейка продуктов с поддержкой новых GPU Volta включает рабочую станцию 7048GR-TR для высокопроизводительных GPU-вычислений, серверы 4028GR-TXRT, 4028GR-TRT и 4028GR-TR2 для самых требовательных приложений глубокого обучения и серверы 1028GQ-TRT для, например, сложных аналитических задач.
Кроме того, ряд партнерских систем пополнился решениями китайских производителей, включая Inspur, Lenovo и Huawei, которые анонсировали системы на базе архитектуры Volta для дата-центров интернет-компаний.
Анонс
10 мая 2017 года компания Nvidia представила архитектуру графических процессоров Volta и серию аппаратно-программных разработок, ориентированных на ускорение работы с системами искусственного интеллекта.
Согласно заявлению Дженсена Хуанга CEO Nvidia, Volta станет стандартом высокопроизводительных вычислений. Объединением ядер CUDA и Volta Tensor в унифицированной архитектуре, один сервер на платформе GPU Tesla V100 сможет заменить сотни центральных процессоров в сфере высокопроизводительных вычислений.
Подрядчики-лидеры по количеству проектов
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
Данные не найдены
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
Данные не найдены
Распределение систем по количеству проектов, не включая партнерские решения
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)
![](/skins/ta/img/0.gif)