8 800 500-99-26 Для звонков по России

Игровые ПК

Все модели

Модельный ряд
DigitalRazor

Уникальные

Уникальные компьютеры
с твоим дизайном

ПК в наличии

ПК готовые к отгрузке
в день заказа

Конфигуратор

Собрать
компьютер мечты

Подобрать игровой компьютер

По особенностям

По задачам

По видеокарте

По процессору

По цене

По играм

Рабочие станции

Персональные системы для 3D-графики, видеомонтажа и инжиниринга. Максимальная стабильность в профессиональном ПО.

GPU-серверы

Платформы для ИИ и HPC с поддержкой до 8 GPU. Создание отказоустойчивых кластеров для непрерывной обработки данных.

Подобрать рабочую станцию

По направлению

По задачам ИИ

По видеокарте

По процессору

По программам

GPU-серверы

Посмотреть все

RackStation Ai

Компактные решения для рендер-ферм, VFX и инференса

DevBox AI

Для локального обучения LLM, генеративных моделей и R&D

Scale

Для LLM > 70b, генеративных моделей и корпоративных задач.

HPC

Для построения AI кластеров, R&D центров и дата-центров

Ответьте на несколько вопросов о проекте — инженер подготовит детальный расчет

Подобрать GPU-сервер

По направлению

Серверы для ИИ

По задачам ИИ

По видеокарте

По конфигурации

Услуги

Посмотреть все

Апгрейд центр

Трейд-ин

Аксессуары

Клиентам

Подробные правила и условия обмена и возврата товаров

Частые вопросы

Быстрый способ найти ответ на интересующий вас вопрос

Компания

Почему выбирают компанию DigitalRazor

Уникальность, агрессивный дизайн, эффективность и мощная производительность.

Подробнее

Контакты Связаться с нами Отзывы Более 20 тыс. довольных клиентов Вакансии Стань частью нашей команды Проекты Истории реализованных проектов

Медиа

Новости События из мира игр, технологий и индустрии Статьи Полезные статьи о железе, играх и всём, что между

8 800 500-99-26 Ежедневно с 10:00 до 21:00

Главная
Медиа
Новости
Софт
Kimi K2.7 Code: триллион параметров — сколько GPU

Kimi K2.7 Code: триллион параметров — сколько GPU

Софт

19.06.2026

2 мин

Kimi K2.7 Code: триллион параметров — сколько GPU

DigitalRazor

Подписаться в Telegram

Содержание 4 раздела

Краткое содержание Что за модель Сколько нужно видеопамяти Кому это нужно

Подберём сервер под вашу задачу

Подберём конфигурацию сервера и отправим предложение.

Смотреть серверы

или свяжитесь с нами

Подберём сервер под задачи

Ответьте на несколько вопросов — подготовим предложение

Moonshot AI выложила в открытый доступ Kimi K2.7 Code — модель для агентного программирования на триллион параметров. Веса открыты, лицензия MIT: можно поднять у себя и не отдавать код в чужое облако. Остаётся один вопрос — какое железо это потянет. И вот тут начинается интересное: одной видеокарты, вопреки первому впечатлению, не хватит.

Краткое содержание

1 триллион параметров всего, активны лишь 32 миллиарда на токен — это «смесь экспертов» (MoE) из 384 экспертов;
веса открыты, лицензия MIT, запуск через vLLM, SGLang или KTransformers — модель остаётся в вашем периметре;
контекст 256 тысяч токенов, родное квантование INT4;
на диске веса занимают около 595 ГБ — это не одна карта, а сервер с полутерабайтом видеопамяти.

Что за модель

Kimi K2.7 Code заточена под агентное программирование: длинные автономные сессии, где модель сама ведёт задачу через множество шагов. Архитектура разрежённая — из триллиона параметров на каждый токен работают лишь 32 миллиарда, остальное «спит». По сравнению с прошлой версией K2.6 она тратит примерно на треть меньше токенов на рассуждения. На агентных тестах держится рядом с закрытыми флагманами GPT-5.5 и Claude Opus, местами чуть позади — но при этом полностью открыта.

1 триллион параметров, активны 32 миллиарда на токен — MoE из 384 экспертов;
контекст 256 тысяч токенов, внимание Multi-Head Latent Attention;
родное квантование INT4, фреймворки vLLM, SGLang, KTransformers;
лицензия MIT, веса открыты на Hugging Face.

Сколько нужно видеопамяти

Подвох прячется в слове «активны». На каждый токен модель задействует лишь 32 миллиарда параметров, и отсюда легко сделать вывод, что хватит одной карты на 32–40 ГБ. Это ловушка. Активная часть меняется от токена к токену, поэтому в памяти должны лежать все веса целиком, а они в родном INT4 занимают около 595 ГБ на диске. Значит, и видеопамяти нужно того же порядка — полтерабайта с лишним.

На практике это сервер с несколькими ускорителями. Восемь карт по 80 ГБ дают 640 ГБ — впритык под веса и контекст. Нужен запас под длинные сессии и KV-кеш на 256 тысяч токенов — берите ускорители на 96 или 141 ГБ. Разрежённая архитектура выручает скоростью: считается только активная часть, инференс идёт быстро. А память она не экономит — её нужно ровно столько, сколько весит вся модель.

Кому это нужно

Главный сценарий — собственный агент-программист внутри компании, когда код не должен покидать периметр. Лицензия MIT снимает юридические вопросы коммерческого использования. Тем, кому не нужен весь триллион локально, остаётся официальный API: входной миллион токенов стоит около 0,95 доллара. Но как только важны приватность кода и предсказуемая цена на потоке, экономика своего сервера начинает обыгрывать облако. В России узкое место не сама модель, а доступность и цена ускорителей на 80 ГБ и выше.

Мнение DigitalRazor

Kimi K2.7 Code — сильная открытая модель, но порог входа высокий: это не настольная видеокарта, а сервер с полутерабайтом видеопамяти. Для постоянного потока задач и закрытого кода такой сервер окупается против облачного API; для разовых экспериментов проще начать с аренды или официального доступа. Главный риск в России — не модель, а наличие и цена ускорителей на 80 ГБ и выше. Поможем собрать и просчитать GPU-сервер под конкретный объём инференса.

Для каких задач

Подробнее

Видеокарты

RTX / RTX PRO / H200 NVL

Объем видеопамяти до 282 ГБ

Процессоры

Threadripper PRO

Количество ядер до 96

RAM до 1024 ГБ DDR5

Форм-фактор 4.5U

Для каких задач

Подробнее

Видеокарты

RTX / RTX PRO / H200 NVL

Объем видеопамяти до 576 ГБ

Процессоры

Threadripper PRO

Количество ядер до 96

RAM до 1024 ГБ DDR5

Форм-фактор 6.5U

Для каких задач

Подробнее

Видеокарты

RTX PRO 6000 / RTX 5090

Объем видеопамяти до 768 ГБ

Процессоры

AMD Epyc, Intel Xeon

Количество ядер до 320

RAM до 3072 ГБ DDR5

Форм-фактор 6U

Для каких задач

Подробнее

Видеокарты

L40s / RTX PRO / H200 NVL

Объем видеопамяти до 564 ГБ

Процессоры

AMD EPYC, Intel Xeon

Количество ядер до 128

RAM до 1536 ГБ DDR5

Форм-фактор 2U

Для каких задач

Подробнее

Видеокарты

L40s / RTX PRO / H200 NVL

Объем видеопамяти до 1128 ГБ

Процессоры

AMD EPYC, Intel Xeon

Количество ядер до 256

RAM до 2048 ГБ DDR5

Форм-фактор 4U

Для каких задач

Подробнее

Видеокарты

NVIDIA H200 SXM

Объем видеопамяти до 1128 ГБ

Процессоры

AMD EPYC, Intel Xeon

Количество ядер до 256

RAM до 2048 ГБ DDR5

Форм-фактор 5U

Подберём сервер под вашу задачу

Подберём конфигурацию сервера и отправим предложение.

Смотреть серверы

или свяжитесь с нами

ИИ

Автор DigitalRazor

Мы более 10 лет разрабатываем и производим современные компьютеры, рабочие станции и GPU-серверы, сочетая технологии, опыт и индивидуальный подход.
Наша миссия — делать выбор техники простым и вдохновлять пользователей на новые достижения.

Все статьи автора