8 800 500-99-26 Для звонков по России
DDN AI400X3M: 190 ГБ/с, чтобы ускорители не ждали
Железо
2 мин

DDN AI400X3M: 190 ГБ/с, чтобы ускорители не ждали

DigitalRazor
DigitalRazor
Подписаться в Telegram
Содержание 4 раздела
Краткое содержание Почему дорогие ускорители простаивают Кэш внимания мимо видеопамяти Где подвох
Подберём сервер под вашу задачу

Подберём конфигурацию сервера и отправим предложение.

Смотреть серверы
или свяжитесь с нами
Telegram Telegram WhatsApp WhatsApp ВКонтакте ВКонтакте MAX MAX

Подберём сервер под задачи

Ответьте на несколько вопросов — подготовим предложение

DDN привезла на ISC 2026 новое хранилище для ИИ — AI400X3M. Логика простая: дорогие ускорители всё чаще простаивают не из-за нехватки вычислений, а потому что ждут данные. Компактный флеш-модуль высотой 2U выдаёт до 190 ГБ/с на чтение и держит до 30 петабайт на стойку. А ещё выгружает кэш внимания из видеопамяти на быстрый диск — освобождает её под саму модель.

Краткое содержание

  • AI400X3M — флеш-модуль высотой 2U: до 190 ГБ/с на чтение, на 35% быстрее прошлого поколения;
  • до 30 петабайт на стойку, накопители NVMe на PCIe Gen5, параллельная файловая система EXAScaler;
  • выгрузка кэша внимания (KV cache) из видеопамяти на быстрое хранилище через NVIDIA Dynamo;
  • доступность — конец третьего квартала 2026 года; класс решения — крупные ИИ-кластеры.

Почему дорогие ускорители простаивают

Узкое место ИИ-кластера давно не в самих картах. Сотни ускорителей в стойке считают быстрее, чем хранилище успевает подавать им данные, и часть времени попросту ждут. AI400X3M бьёт ровно в эту точку. Это очередное поколение платформы EXAScaler: параллельная файловая система раздаёт данные десяткам узлов одновременно, а не гонит их в одну трубу.

  • до 190 ГБ/с на чтение — против примерно 140 ГБ/с у прошлого AI400X3, прибавка около 35%;
  • до 30 петабайт ёмкости на стойку;
  • накопители NVMe с интерфейсом PCIe Gen5, формат модуля — 2U;
  • связь с узлами ускорителей по высокоскоростному InfiniBand или Ethernet.
DDN AI400X3i

Кэш внимания мимо видеопамяти

Второе, что показала DDN, — выгрузка кэша внимания на хранилище. Звучит узко, но эффект прямой. Когда языковая модель отвечает, ускоритель держит «кэш ключей и значений» по всем уже обработанным токенам, чтобы не считать их заново. На длинном контексте этот кэш разрастается и съедает дорогую видеопамять. Как только её перестаёт хватать, часть данных приходится пересчитывать, и карта снова простаивает.

DDN выгружает этот кэш на быстрое хранилище и по запросу быстро отдаёт обратно. Работает это через NVIDIA Dynamo и доступно на платформах Infinia и EXAScaler. Выигрыш — больше свободной видеопамяти под саму модель и длинный контекст, меньше пересчётов и простоя ускорителей.

Где подвох

Несколько оговорок, без которых картина неполная. Сроки: общая доступность AI400X3M обещана только к концу третьего квартала 2026 года, сейчас это анонс, а не товар на складе. Цена не названа, а для российского рынка это значит параллельный импорт и отсутствие прямой поддержки; пусконаладка параллельной файловой системы потребует своей экспертизы. Выгрузка кэша завязана на стек NVIDIA и быструю сеть, так что «поставил и забыл» не выйдет. И главное: это класс крупных ИИ-кластеров и «ИИ-фабрик» — для одного-двух инференс-узлов такая платформа избыточна.

Мнение DigitalRazor

AI400X3M — про устранение простоя дорогих ускорителей, а не про красивые цифры в пресс-релизе. На кластере в десятки и сотни карт такое хранилище окупается тем, что ускорители перестают ждать данные. Но под один-два инференс-узла параллельная файловая система избыточна: рядом с картами достаточно выделенного флеш-узла на NVMe. Считайте под свою нагрузку, где реально теряете время — на вычислениях или на подаче данных.

Для каких задач Компактный GPU-сервер до 2 видеокарт для начальных задач в AI и графике. Оптимален для инференса, визуализации, VFX и рендеринга в студиях и лабораториях, где важна гибкость.
Подробнее
Видеокарты
RTX / RTX PRO / H200 NVL
Объем видеопамяти до 282 ГБ
Процессоры
Threadripper PRO
Количество ядер до 96
RAM до 1024 ГБ DDR5
Форм-фактор 4.5U
Для каких задач Универсальная платформа на 4–6 GPU для локального обучения моделей и генеративных задач. Подходит для команд, которым важна надёжность сервера и свобода выбора графики — от RTX 5090 до PRO RTX 6000.
Подробнее
Видеокарты
RTX / RTX PRO / H200 NVL
Объем видеопамяти до 576 ГБ
Процессоры
Threadripper PRO
Количество ядер до 96
RAM до 1024 ГБ DDR5
Форм-фактор 6.5U
Для каких задач Сервер промышленного уровня на 8 GPU с кластерной архитектурой. Предназначен для дата-центров и AI-ферм, где требуется масштабируемость и полная загрузка ресурсов под обучение LLM и R&D.
Подробнее
Видеокарты
RTX PRO 6000 / RTX 5090
Объем видеопамяти до 768 ГБ
Процессоры
AMD Epyc, Intel Xeon
Количество ядер до 320
RAM до 3072 ГБ DDR5
Форм-фактор 6U
Для каких задач Серия серверов для кластеризации на 4 GPU. Предназначены для дата-центров и AI-ферм, где требуется повышенная плотность для обучение LLM и R&D.
Подробнее
Видеокарты
L40s / RTX PRO / H200 NVL
Объем видеопамяти до 564 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 128
RAM до 1536 ГБ DDR5
Форм-фактор 2U
Для каких задач Серия серверов для кластеризации на 8 GPU. Предназначены для дата-центров и AI-ферм, где требуется повышенная плотность для обучение LLM и R&D.
Подробнее
Видеокарты
L40s / RTX PRO / H200 NVL
Объем видеопамяти до 1128 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 256
RAM до 2048 ГБ DDR5
Форм-фактор 4U
Для каких задач HGX объединяет 8 видеокарт NVIDIA H200, достигая экстремальной плотности производительности. Благодаря внутренней связности NVSwitch мгновенно интегрируется в масштабные вычислительные кластеры.
Подробнее
Видеокарты
NVIDIA H200 SXM
Объем видеопамяти до 1128 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 256
RAM до 2048 ГБ DDR5
Форм-фактор 5U
Подберём сервер под вашу задачу

Подберём конфигурацию сервера и отправим предложение.

Смотреть серверы
или свяжитесь с нами
Telegram Telegram WhatsApp WhatsApp ВКонтакте ВКонтакте MAX MAX
9.4К

Так же будет интересно почитать

Сайт использует cookies
Узнать подробнее