Карты для нейросетей выделяются большим объемом памяти, тензорными ядрами и поддержкой FP8/FP4 — это отличает их от игровых GPU, где главное отрисовка кадров, а не параллельные вычисления для ИИ.
Видеокарты для нейросетей заточены под обучение и запуск моделей: у них до 141 ГБ VRAM (вместо 8–16 ГБ у игровых), высокая пропускная способность памяти для батчей данных и специализированные ядра для матричных операций, ускоряющие PyTorch/TensorFlow в 10–30 раз. Игровые фокусируются на RT-ядрах для графики, а ИИ-GPU — на Tensor Cores при TDP до 700 Вт.
NVIDIA RTX 5090
– Память: 32 ГБ GDDR7
– CUDA-ядра: 21 760
– TDP: 575 Вт
– Производительность: 5841 AI TOPS (FP8)
NVIDIA H200 SXM
– Память: 141 ГБ HBM3e
– Пропускная способность: 4,8 ТБ/с
– Tensor Cores: >4000
– TDP: 700 Вт
NVIDIA RTX 5080 Super
– Память: 24–32 ГБ GDDR7
– CUDA-ядра: ~10 752+
– TDP: 300 Вт
– Tensor Cores: 5-го поколения
NVIDIA H100 SXM
– Память: 80 ГБ HBM3
– Пропускная способность: 3,35 ТБ/с
– Tensor Cores: 1900+
– TDP: 700 Вт
NVIDIA RTX 6000 Ada
– Память: 48 ГБ GDDR6 ECC
– CUDA-ядра: 18 176
– TDP: 300 Вт
– Производительность: 91 TFLOPS (FP32)
