
DDN AI400X3M: 190 ГБ/с, чтобы ускорители не ждали
Подберём сервер под задачи
Ответьте на несколько вопросов — подготовим предложение
DDN привезла на ISC 2026 новое хранилище для ИИ — AI400X3M. Логика простая: дорогие ускорители всё чаще простаивают не из-за нехватки вычислений, а потому что ждут данные. Компактный флеш-модуль высотой 2U выдаёт до 190 ГБ/с на чтение и держит до 30 петабайт на стойку. А ещё выгружает кэш внимания из видеопамяти на быстрый диск — освобождает её под саму модель.
Краткое содержание
- AI400X3M — флеш-модуль высотой 2U: до 190 ГБ/с на чтение, на 35% быстрее прошлого поколения;
- до 30 петабайт на стойку, накопители NVMe на PCIe Gen5, параллельная файловая система EXAScaler;
- выгрузка кэша внимания (KV cache) из видеопамяти на быстрое хранилище через NVIDIA Dynamo;
- доступность — конец третьего квартала 2026 года; класс решения — крупные ИИ-кластеры.
Почему дорогие ускорители простаивают
Узкое место ИИ-кластера давно не в самих картах. Сотни ускорителей в стойке считают быстрее, чем хранилище успевает подавать им данные, и часть времени попросту ждут. AI400X3M бьёт ровно в эту точку. Это очередное поколение платформы EXAScaler: параллельная файловая система раздаёт данные десяткам узлов одновременно, а не гонит их в одну трубу.
- до 190 ГБ/с на чтение — против примерно 140 ГБ/с у прошлого AI400X3, прибавка около 35%;
- до 30 петабайт ёмкости на стойку;
- накопители NVMe с интерфейсом PCIe Gen5, формат модуля — 2U;
- связь с узлами ускорителей по высокоскоростному InfiniBand или Ethernet.
Кэш внимания мимо видеопамяти
Второе, что показала DDN, — выгрузка кэша внимания на хранилище. Звучит узко, но эффект прямой. Когда языковая модель отвечает, ускоритель держит «кэш ключей и значений» по всем уже обработанным токенам, чтобы не считать их заново. На длинном контексте этот кэш разрастается и съедает дорогую видеопамять. Как только её перестаёт хватать, часть данных приходится пересчитывать, и карта снова простаивает.
DDN выгружает этот кэш на быстрое хранилище и по запросу быстро отдаёт обратно. Работает это через NVIDIA Dynamo и доступно на платформах Infinia и EXAScaler. Выигрыш — больше свободной видеопамяти под саму модель и длинный контекст, меньше пересчётов и простоя ускорителей.
Где подвох
Несколько оговорок, без которых картина неполная. Сроки: общая доступность AI400X3M обещана только к концу третьего квартала 2026 года, сейчас это анонс, а не товар на складе. Цена не названа, а для российского рынка это значит параллельный импорт и отсутствие прямой поддержки; пусконаладка параллельной файловой системы потребует своей экспертизы. Выгрузка кэша завязана на стек NVIDIA и быструю сеть, так что «поставил и забыл» не выйдет. И главное: это класс крупных ИИ-кластеров и «ИИ-фабрик» — для одного-двух инференс-узлов такая платформа избыточна.
Мнение DigitalRazor
AI400X3M — про устранение простоя дорогих ускорителей, а не про красивые цифры в пресс-релизе. На кластере в десятки и сотни карт такое хранилище окупается тем, что ускорители перестают ждать данные. Но под один-два инференс-узла параллельная файловая система избыточна: рядом с картами достаточно выделенного флеш-узла на NVMe. Считайте под свою нагрузку, где реально теряете время — на вычислениях или на подаче данных.














