8 800 500-99-26 Для звонков по России

Игровые ПК

Все модели

Модельный ряд
DigitalRazor

Уникальные

Уникальные компьютеры
с твоим дизайном

ПК в наличии

ПК готовые к отгрузке
в день заказа

Конфигуратор

Собрать
компьютер мечты

Подобрать игровой компьютер

По особенностям

По задачам

По видеокарте

По процессору

По цене

По играм

Рабочие станции

Персональные системы для 3D-графики, видеомонтажа и инжиниринга. Максимальная стабильность в профессиональном ПО.

GPU-серверы

Платформы для ИИ и HPC с поддержкой до 8 GPU. Создание отказоустойчивых кластеров для непрерывной обработки данных.

Подобрать рабочую станцию

По направлению

По задачам ИИ

По видеокарте

По процессору

По программам

GPU-серверы

Посмотреть все

RackStation Ai

Компактные решения для рендер-ферм, VFX и инференса

DevBox AI

Для локального обучения LLM, генеративных моделей и R&D

Scale

Для LLM > 70b, генеративных моделей и корпоративных задач.

HPC

Для построения AI кластеров, R&D центров и дата-центров

Ответьте на несколько вопросов о проекте — инженер подготовит детальный расчет

Подобрать GPU-сервер

По задачам ИИ

По видеокарте

По конфигурации

По процессору

Услуги

Посмотреть все

Апгрейд центр

Трейд-ин

Аксессуары

Клиентам

Подробные правила и условия обмена и возврата товаров

Частые вопросы

Быстрый способ найти ответ на интересующий вас вопрос

Компания

Почему выбирают компанию DigitalRazor

Уникальность, агрессивный дизайн, эффективность и мощная производительность.

Подробнее

Контакты Связаться с нами Отзывы Более 20 тыс. довольных клиентов Вакансии Стань частью нашей команды Проекты Истории реализованных проектов

Медиа

Новости События из мира игр, технологий и индустрии Статьи Полезные статьи о железе, играх и всём, что между

8 800 500-99-26 Ежедневно с 10:00 до 20:00

Главная
Медиа
Новости
Софт
Сбер выпустил открытые новые MoE-модели GigaChat 3.1

Сбер выпустил открытые новые MoE-модели GigaChat 3.1

Олег Олегович

Новости

Сбер выпустил открытые новые MoE-модели GigaChat 3.1

27.03.2026

2 мин

Подписаться в Telegram

Содержание

Краткое содержание
Переход на архитектуру MoE
Увеличенное контекстное окно
Снижение потребления памяти и рост скорости

Не знаете, какой ПК взять?

Ответьте на несколько вопросов — получите готовую сборку с ценой.

Отечественная корпорация официально выпустила крупное обновление фирменного семейства больших языковых моделей. Компания представила сразу две новые нейросети — GigaChat-3.1-Ultra и GigaChat-3.1-Lightning. Обе новинки получили поддержку функции рассуждения, огромное контекстное окно и стали доступны для использования под полностью открытой лицензией MIT.

Краткое содержание

Сбер выпустил языковые модели GigaChat-3.1-Ultra и Lightning;
В основу нейросетей легла эффективная архитектура MoE;
Старшая модель Ultra получила 702 миллиарда параметров;
Контекстное окно новинок расширено до 256 тысяч токенов;
Исходный код доступен бесплатно по открытой лицензии MIT.

Переход на архитектуру MoE

Главным нововведением в релизе стало принципиальное изменение структуры языковых моделей. Создатели отказались от плотной архитектуры в пользу MoE. Такая компоновка предполагает, что при генерации ответов активируется лишь небольшая часть доступных параметров нейросети. Подобный подход позволяет существенно снизить требования к аппаратному обеспечению при локальном развёртывании системы. Младшая модель Lightning располагает 10 миллиардами параметров, в то время как старшая версия Ultra насчитывает 702 миллиарда.

Увеличенное контекстное окно

Вместо стандартного механизма внимания теперь применяется технология MLA. Это решение сжимает данные кэша в латентное представление. В результате нейросеть потребляет гораздо меньше оперативной памяти и работает значительно быстрее при обработке длинных текстов и сложных запросов. Контекстное окно новинок достигает 256 тысяч токенов, что даёт возможность загружать в модель целые книги или огромные массивы технической документации.

Снижение потребления памяти и рост скорости

В процессе создания GigaChat 3.1 команда провела масштабную работу над ошибками прошлых версий. Новые модели стали гораздо реже галлюцинировать и практически перестали уходить в бесконечные циклы генерации текста. Особое внимание специалисты уделили оптимизации процесса инференса.

В новых релизах больше не используется посттренировочная квантизация. Этот метод хорошо показывал себя в синтетических тестах, но негативно влиял на качество работы нейросети в реальных задачах. Вместо этого этап оптимизации полностью перевели в режим вычислений FP8. Такое решение увеличило общую эффективность алгоритмов и сократило потребление видеопамяти ровно в два раза. Дополнительное применение технологии MTP обеспечило моделям прирост скорости инференса до 38% по сравнению с предыдущими базовыми версиями.

Новые нейросети отлично подходят для создания умных корпоративных ассистентов, продвинутых чат-ботов и различных приложений на базе ИИ. Для стабильной работы и обучения подобных моделей отлично подходят современные серверы для искусственного интеллекта, оснащённые мощными графическими ускорителями. Младшую версию можно локально развернуть и на рабочих станциях.

Не пропусти главное в мире ПК

Мы публикуем последние новости из компьютерного мира. Подписывайся, чтобы быть в курсе и ничего не пропустить.

Подписаться 145к

ИИ ОЗУ

Автор Олег Олегович

С доставшимся от родителей воображением рассказываю о компьютерах и технологиях. Так что речь не о классике, если видишь слово «блок». В 14 лет починил видеокарту в духовке. Всё, что с вентилятором и радиатором — это ко мне.

Все статьи автора