8 800 500-99-26 Для звонков по России
GLM-5.2: открытые 753 млрд против GPT-5.5
Софт
3 мин

GLM-5.2: открытые 753 млрд против GPT-5.5

DigitalRazor
DigitalRazor
Подписаться в Telegram
Содержание 5 разделов
Краткое содержание Что выложила Z.ai Чем обошла закрытых конкурентов Сколько железа нужно, чтобы поднять её у себя Где подвох
Получите готовый ПК под свои задачи

Подберём ПК под ваши задачи, соберём, протестируем и доставим готовым к работе.

Собрать свой ПК
или свяжитесь с нами
Telegram Telegram WhatsApp WhatsApp ВКонтакте ВКонтакте MAX MAX

Подберём игровой ПК за 2 шага

Ответьте на несколько вопросов — покажем готовые сборки

Z.ai (бывшая Zhipu AI) выложила в открытый доступ GLM-5.2 — модель на 753 миллиарда параметров с контекстом в миллион токенов и лицензией MIT. Для бизнеса важно вот что: на коде она обходит закрытую GPT-5.5, а держать её можно в своём контуре, без облака. Остаётся один вопрос — какое железо потянет такую модель.

Краткое содержание

  • 753 млрд параметров всего, активны лишь 98 млрд — это «смесь экспертов» (MoE), 8 из 256 на каждый токен;
  • веса открыты, лицензия MIT — модель можно поднять в своём периметре и использовать в коммерции;
  • контекст до 1 млн токенов; на коде обходит GPT-5.5 — SWE-bench Pro 62,1 против 58,6;
  • под локальный запуск нужно около 754 ГБ видеопамяти в FP8 и до 1,5 ТБ в BF16.

Что выложила Z.ai

GLM-5.2 — открытая модель от китайской Z.ai, бывшей Zhipu AI. Внутри «смесь экспертов»: из 753 миллиардов параметров на каждый токен работают только 98 миллиардов, восемь экспертов из 256. Это держит цену инференса ниже, чем у плотной модели того же размера. Контекст подняли с прежних 200 тысяч токенов до миллиона, а обучали модель на длинных сессиях кодовых агентов — отсюда её сила в инженерных задачах.

Чем обошла закрытых конкурентов

Сравнение GLM-5.2 с GPT-5.5 на инженерных бенчмарках

Главная интрига — открытая модель догнала и местами обошла закрытых лидеров. На Design Arena GLM-5.2 вышла на первое место с рейтингом 1360 против 1350 у Claude Fable 5. На инженерных тестах счёт тоже в её пользу:

  • SWE-bench Pro — 62,1 против 58,6 у GPT-5.5;
  • FrontierSWE — 74,4 процента против 72,6;
  • Terminal-Bench 2.1 — 81,0; это первая открытая модель, перешагнувшая планку в 80 процентов.

Плюс цена: за токен GLM-5.2 выходит примерно в шесть раз дешевле GPT-5.5. Для тех, кто гоняет кодового ассистента на потоке, разница в счёте за месяц получается ощутимой.

Сколько железа нужно, чтобы поднять её у себя

Открытые веса — это половина дела. Вторая половина в том, на чём всё это запускать. Модель большая, и даже в сжатом виде требует серверного масштаба памяти:

  • FP8 — около 754 ГБ только под веса: это узел из восьми ускорителей со 140 ГБ видеопамяти и больше, восемь карт дают примерно 1,1 ТБ и оставляют запас под контекст;
  • BF16, полные веса — порядка 1,5 ТБ, это уже два таких узла, шестнадцать ускорителей;
  • контекст в миллион токенов раздувает кэш, поэтому память нужна сверх весов — закладывайте запас.

Архитектура немного помогает: механизм IndexShare снижает число операций в 2,9 раза, а предсказание нескольких токенов сразу ускоряет генерацию. Но на объём памяти это не влияет — веса всё равно нужно куда-то положить.

Где подвох

GLM-5.2 — не коробка под столом. Это сервер, а под полные веса — два сервера, набитых ускорителями с большой видеопамятью. Главный барьер в России именно тут: достать восемь, а то и шестнадцать карт уровня 140 гигабайт сложнее и дороже, чем саму модель скачать. Лицензия MIT в этом смысле — приятная редкость: коммерческое использование без региональных ограничений, что для импортозамещения важно. Модель заточена под код и агентов; ради обычного чат-бота держать отдельный узел смысла мало.

Мнение DigitalRazor

GLM-5.2 — редкий случай, когда открытая модель реально догнала закрытых лидеров на коде и при этом остаётся в вашем периметре. Но порог входа железный: под FP8 нужен узел из восьми ускорителей с большой видеопамятью, под полные веса — два. Если цель — свой ассистент для разработки с кодом внутри контура, посчитайте экономику собственного GPU-сервера против аренды и облачного API на горизонте года. Под нужный формат модели мы соберём узел и заложим запас памяти под длинный контекст.

Для каких задач Компактный GPU-сервер до 2 видеокарт для начальных задач в AI и графике. Оптимален для инференса, визуализации, VFX и рендеринга в студиях и лабораториях, где важна гибкость.
Подробнее
Видеокарты
RTX / RTX PRO / H200 NVL
Объем видеопамяти до 282 ГБ
Процессоры
Threadripper PRO
Количество ядер до 96
RAM до 1024 ГБ DDR5
Форм-фактор 4.5U
Для каких задач Универсальная платформа на 4–6 GPU для локального обучения моделей и генеративных задач. Подходит для команд, которым важна надёжность сервера и свобода выбора графики — от RTX 5090 до PRO RTX 6000.
Подробнее
Видеокарты
RTX / RTX PRO / H200 NVL
Объем видеопамяти до 576 ГБ
Процессоры
Threadripper PRO
Количество ядер до 96
RAM до 1024 ГБ DDR5
Форм-фактор 6.5U
Для каких задач Сервер промышленного уровня на 8 GPU с кластерной архитектурой. Предназначен для дата-центров и AI-ферм, где требуется масштабируемость и полная загрузка ресурсов под обучение LLM и R&D.
Подробнее
Видеокарты
RTX PRO 6000 / RTX 5090
Объем видеопамяти до 768 ГБ
Процессоры
AMD Epyc, Intel Xeon
Количество ядер до 320
RAM до 3072 ГБ DDR5
Форм-фактор 6U
Для каких задач Серия серверов для кластеризации на 4 GPU. Предназначены для дата-центров и AI-ферм, где требуется повышенная плотность для обучение LLM и R&D.
Подробнее
Видеокарты
L40s / RTX PRO / H200 NVL
Объем видеопамяти до 564 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 128
RAM до 1536 ГБ DDR5
Форм-фактор 2U
Для каких задач Серия серверов для кластеризации на 8 GPU. Предназначены для дата-центров и AI-ферм, где требуется повышенная плотность для обучение LLM и R&D.
Подробнее
Видеокарты
L40s / RTX PRO / H200 NVL
Объем видеопамяти до 1128 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 256
RAM до 2048 ГБ DDR5
Форм-фактор 4U
Для каких задач HGX объединяет 8 видеокарт NVIDIA H200, достигая экстремальной плотности производительности. Благодаря внутренней связности NVSwitch мгновенно интегрируется в масштабные вычислительные кластеры.
Подробнее
Видеокарты
NVIDIA H200 SXM
Объем видеопамяти до 1128 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 256
RAM до 2048 ГБ DDR5
Форм-фактор 5U

Не пропусти главное в мире ПК

Мы публикуем последние новости из компьютерного мира. Подписывайся, чтобы быть в курсе и ничего не пропустить.

Подписаться
Получите готовый ПК под свои задачи

Подберём ПК под ваши задачи, соберём, протестируем и доставим готовым к работе.

Собрать свой ПК
или свяжитесь с нами
Telegram Telegram WhatsApp WhatsApp ВКонтакте ВКонтакте MAX MAX
9.8К

Так же будет интересно почитать

Сайт использует cookies
Узнать подробнее