8 800 500-99-26 Для звонков по России

Игровые ПК

Все модели

Модельный ряд
DigitalRazor

Уникальные

Уникальные компьютеры
с твоим дизайном

ПК в наличии

ПК готовые к отгрузке
в день заказа

Конфигуратор

Собрать
компьютер мечты

Подобрать игровой компьютер

По особенностям

По задачам

По видеокарте

По процессору

По цене

По играм

Рабочие станции

Персональные системы для 3D-графики, видеомонтажа и инжиниринга. Максимальная стабильность в профессиональном ПО.

GPU-серверы

Платформы для ИИ и HPC с поддержкой до 8 GPU. Создание отказоустойчивых кластеров для непрерывной обработки данных.

Подобрать рабочую станцию

По направлению

По задачам ИИ

По видеокарте

По процессору

По программам

GPU-серверы

Посмотреть все

RackStation Ai

Компактные решения для рендер-ферм, VFX и инференса

DevBox AI

Для локального обучения LLM, генеративных моделей и R&D

Scale

Для LLM > 70b, генеративных моделей и корпоративных задач.

HPC

Для построения AI кластеров, R&D центров и дата-центров

Ответьте на несколько вопросов о проекте — инженер подготовит детальный расчет

Подобрать GPU-сервер

По направлению

Серверы для ИИ

По задачам ИИ

По видеокарте

По конфигурации

Услуги

Посмотреть все

Апгрейд центр

Трейд-ин

Аксессуары

Клиентам

Подробные правила и условия обмена и возврата товаров

Частые вопросы

Быстрый способ найти ответ на интересующий вас вопрос

Компания

Почему выбирают компанию DigitalRazor

Уникальность, агрессивный дизайн, эффективность и мощная производительность.

Подробнее

Контакты Связаться с нами Отзывы Более 20 тыс. довольных клиентов Вакансии Стань частью нашей команды Проекты Истории реализованных проектов

Медиа

Новости События из мира игр, технологий и индустрии Статьи Полезные статьи о железе, играх и всём, что между

8 800 500-99-26 Ежедневно с 10:00 до 21:00

Главная
Медиа
Новости
Софт
MiniMax M3: что нужно, чтобы поднять 428 млрд у себя

MiniMax M3: что нужно, чтобы поднять 428 млрд у себя

Софт

15.06.2026

2 мин

MiniMax M3: что нужно, чтобы поднять 428 млрд у себя

DigitalRazor

Подписаться в Telegram

Содержание 4 раздела

Краткое содержание Что за модель Сколько железа нужно, чтобы поднять её у себя Что это значит для закупщика

Получите готовый ПК под свои задачи

Подберём ПК под ваши задачи, соберём, протестируем и доставим готовым к работе.

Собрать свой ПК

или свяжитесь с нами

Подберём игровой ПК за 2 шага

Ответьте на несколько вопросов — покажем готовые сборки

MiniMax выложила в открытый доступ M3 — мультимодальную модель на 428 млрд параметров с контекстом в миллион токенов. Веса доступны всем, запускать можно у себя. Вопрос ровно один: какое железо для этого нужно. Разбираем по «железному» счёту — сколько это видеопамяти и сколько ускорителей под одну такую модель.

Краткое содержание

428 млрд параметров всего, активны лишь 23 млрд — архитектура «смесь экспертов» (MoE);
открытые веса, запуск через vLLM, SGLang или Transformers — модель остаётся в вашем периметре;
родная мультимодальность (текст, изображения, видео) и контекст до 1 млн токенов;
чтобы держать модель локально, нужно от ~220 ГБ видеопамяти со сжатием и до ~450 ГБ без него.

Что за модель

M3 построена по схеме «смесь экспертов»: из 428 млрд параметров на каждый токен работают только 23 млрд. Вычисления от этого дешевеют — модель отвечает как небольшая, а знает как большая. Сверху — новый механизм внимания MiniMax Sparse Attention: на контексте в миллион токенов разработчики обещают девятикратное ускорение на обработке запроса и пятнадцатикратное на генерации против прошлой версии, M2. Модель родно работает с текстом, картинками и видео, а в тестах на агентные задачи держит крепкий уровень — например, 59 процентов на SWE-Bench Pro.

Сколько железа нужно, чтобы поднять её у себя

Здесь кроется главный нюанс «смеси экспертов» — обманчивая лёгкость. Активны 23 млрд параметров, но в видеопамяти должны лежать все 428 млрд: выгружать неактивных экспертов в оперативную память нельзя, иначе задержки убьют интерактивность. Отсюда и аппетит к видеопамяти. По оценкам сообщества, в сжатом виде модель занимает примерно так:

без сжатия (8 бит) — ориентировочно 430–450 ГБ видеопамяти;
умеренное сжатие (5–6 бит) — около 280–360 ГБ;
агрессивное (4 бита) — порядка 220–250 ГБ при разумном балансе качества;
плюс запас под кэш контекста: миллион токенов требует памяти сверх этого.

Вывод простой: одной видеокартой не обойтись. Даже в сжатии до 4 бит нужен сервер с несколькими ускорителями — например, четыре карты по 80 ГБ или пара по 141 ГБ. Без сжатия счёт идёт уже на шесть-восемь ускорителей. Это полноценный GPU-сервер, а не рабочая станция под столом.

Что это значит для закупщика

Открытые веса дают то, чего не даёт облачный доступ: модель остаётся внутри периметра, данные не уходят наружу, а стоимость запросов не растёт со временем. Плата за это — стартовые вложения в железо. Если M3 нужна под агентов, разработку или работу с длинными документами и при этом критична приватность, экономика складывается в пользу своего GPU-сервера. Если запросов немного, а приватность некритична, дешевле арендовать мощности. Граница проходит по объёму нагрузки и требованиям к данным — и считать её нужно под конкретный сценарий.

Мнение DigitalRazor

M3 — наглядный пример того, как открытые модели разгоняют спрос на серверные GPU. «Смесь экспертов» экономит на вычислениях, но не на памяти: чтобы держать 428 млрд параметров локально, нужен узел с несколькими ускорителями и честно посчитанным объёмом видеопамяти под модель и контекст. Перед закупкой зафиксируйте целевое квантование и длину контекста — от них напрямую зависит, хватит ли четырёх карт или понадобится восемь. Поможем подобрать и собрать GPU-сервер под конкретную модель.

Для каких задач

Подробнее

Видеокарты

RTX / RTX PRO / H200 NVL

Объем видеопамяти до 282 ГБ

Процессоры

Threadripper PRO

Количество ядер до 96

RAM до 1024 ГБ DDR5

Форм-фактор 4.5U

Для каких задач

Подробнее

Видеокарты

RTX / RTX PRO / H200 NVL

Объем видеопамяти до 576 ГБ

Процессоры

Threadripper PRO

Количество ядер до 96

RAM до 1024 ГБ DDR5

Форм-фактор 6.5U

Для каких задач

Подробнее

Видеокарты

RTX PRO 6000 / RTX 5090

Объем видеопамяти до 768 ГБ

Процессоры

AMD Epyc, Intel Xeon

Количество ядер до 320

RAM до 3072 ГБ DDR5

Форм-фактор 6U

Для каких задач

Подробнее

Видеокарты

L40s / RTX PRO / H200 NVL

Объем видеопамяти до 564 ГБ

Процессоры

AMD EPYC, Intel Xeon

Количество ядер до 128

RAM до 1536 ГБ DDR5

Форм-фактор 2U

Для каких задач

Подробнее

Видеокарты

L40s / RTX PRO / H200 NVL

Объем видеопамяти до 1128 ГБ

Процессоры

AMD EPYC, Intel Xeon

Количество ядер до 256

RAM до 2048 ГБ DDR5

Форм-фактор 4U

Для каких задач

Подробнее

Видеокарты

NVIDIA H200 SXM

Объем видеопамяти до 1128 ГБ

Процессоры

AMD EPYC, Intel Xeon

Количество ядер до 256

RAM до 2048 ГБ DDR5

Форм-фактор 5U

Не пропусти главное в мире ПК

Мы публикуем последние новости из компьютерного мира. Подписывайся, чтобы быть в курсе и ничего не пропустить.

Получите готовый ПК под свои задачи

Подберём ПК под ваши задачи, соберём, протестируем и доставим готовым к работе.

Собрать свой ПК

или свяжитесь с нами

ИИ

Автор DigitalRazor

Мы более 10 лет разрабатываем и производим современные компьютеры, рабочие станции и GPU-серверы, сочетая технологии, опыт и индивидуальный подход.
Наша миссия — делать выбор техники простым и вдохновлять пользователей на новые достижения.

Все статьи автора