
Google выпустила Gemma 4 — открытые ИИ-модели нового поколения
Подберём игровой ПК за 2 шага
Ответьте на несколько вопросов — покажем готовые сборки
Google выпустила четвёртое поколение ИИ-моделей под названием Gemma 4. Новинки получили коммерчески открытую лицензию Apache 2.0, которая позволяет свободно использовать, изменять и внедрять нейросети в собственные коммерческие проекты. Инженеры создали четыре разные версии алгоритмов, чтобы охватить все устройства — от компактных смартфонов до мощных серверных кластеров.
Краткое содержание
- Корпорация Google выпустила четыре новые языковые модели Gemma 4;
- Нейросети научились напрямую обрабатывать текст, изображения и аудио;
- Мобильные алгоритмы работают локально без подключения к Сети;
- Для старших версий разработчики увеличили контекстное окно до 256 тысяч токенов.
Архитектура и размеры алгоритмов
Google разделила линейку на два направления. Для серверов и персональных компьютеров компания предлагает большие модели 31B Dense и 26B MoE. Последняя использует архитектуру Mixture of Experts. Во время генерации ответа она активирует всего 3,8 миллиарда параметров из 26 миллиардов доступных. Такой подход позволяет нейросети выдавать текст с огромной скоростью без потери качества. В бенчмарках модель 31B уже вошла в тройку лучших открытых алгоритмов мира.
Для мобильных платформ и умных гаджетов разработчики создали компактные версии E2B и E4B. Они используют 2 и 4 миллиарда параметров соответственно. Эти нейросети экономят оперативную память и берегут заряд батареи. Команда Google оптимизировала их для работы полностью в автономном режиме с почти нулевой задержкой.
Мультимодальность и новые навыки
Все модели поколения Gemma 4 умеют писать качественный программный код и выполнять роль автономных агентов. Они без проблем взаимодействуют со сторонними API, понимают системные инструкции и выдают структурированные данные в формате JSON. Также расширили контекстное окно — старшие версии удерживают в памяти до 256 тысяч токенов, а младшие способны обрабатывать до 128 тысяч.
Ещё одним важным шагом стала продвинутая мультимодальность. Все нейросети из новой линейки умеют читать документы, извлекать графики и распознавать объекты на изображениях. А компактные модели E2B и E4B дополнительно получили нативную поддержку аудио. Они умеют распознавать человеческую речь и переводить её на другие языки напрямую. Для обучения разработчики использовали более 140 языков.
Требования к вычислительной мощности
Компактные модели без проблем запускаются на телефонах, платах Raspberry Pi и микрокомпьютерах NVIDIA Jetson Orin Nano. А вот старшие алгоритмы требуют серьёзных вычислительных ресурсов. Версии 26B и 31B в формате bfloat16 занимают много места, и для их быстрого запуска потребуется один мощный ускоритель уровня NVIDIA H100 с 80 ГБ видеопамяти. Квантованные версии можно запустить и на обычных потребительских видеокартах.
Если ты планируешь внедрять большие нейросети в свои рабочие процессы или хочешь дообучать алгоритмы на собственных базах данных, тебе понадобится надёжное «железо». Специально для таких задач мы собираем мощные рабочие станции и GPU-серверы, которые обеспечивают бесперебойную работу при пиковых нагрузках и легко справляются с тяжёлыми вычислениями.
Не пропусти главное в мире ПК
Мы публикуем последние новости из компьютерного мира. Подписывайся, чтобы быть в курсе и ничего не пропустить.



















