8 800 500-99-26 Для звонков по России
Baidu представила открытую 8B-модель ERNIE-Image для генерации картинок
Софт
2 мин

Baidu представила открытую 8B-модель ERNIE-Image для генерации картинок

DigitalRazor
DigitalRazor
Подписаться в Telegram
Содержание 4 раздела
Краткое содержание Точная работа с текстом и макетами Архитектура и системные требования Преимущества для коммерческой разработки
Получите готовый ПК под свои задачи

Подберём ПК под ваши задачи, соберём, протестируем и доставим готовым к работе.

Собрать свой ПК
или свяжитесь с нами
Telegram Telegram WhatsApp WhatsApp ВКонтакте ВКонтакте MAX MAX

Подберём игровой ПК за 2 шага

Ответьте на несколько вопросов — покажем готовые сборки

Компания Baidu официально выпустила ERNIE-Image — мощную модель для генерации изображений на базе архитектуры Diffusion Transformer (DiT). Разработка содержит 8 миллиардов параметров и распространяется по открытой лицензии. Инструмент позиционируется как решение для точного следования сложным текстовым инструкциям и создания профессиональной графики.

Краткое содержание

  • Baidu выпустила открытую модель ERNIE-Image на базе архитектуры DiT;
  • Нейросеть безошибочно генерирует текст на изображениях, включая китайский и русский языки;
  • Алгоритм поддерживает создание многопанельных комиксов и раскадровок;
  • Для локального запуска требуется потребительская видеокарта с 24 ГБ видеопамяти.

Точная работа с текстом и макетами

Ключевым преимуществом ERNIE-Image выступает способность корректно интегрировать текст в генерируемые изображения. Многие популярные нейросети выдают нечитаемые символы при попытке создать постер или инфографику. Разработка Baidu успешно справляется с плотным макетом и поддерживает мультиязычный рендеринг. Это делает алгоритм подходящим инструментом для проектирования рекламных баннеров и интерфейсов.

ERNIE-Image

Дополнительно нейросеть оптимизирована для генерации структурированных изображений. Алгоритм умеет создавать многопанельные комиксы и раскадровки, сохраняя визуальную согласованность персонажей от кадра к кадру. В тестах на точность выполнения сложных инструкций (GENEval) новая модель занимает лидирующие позиции среди всех решений с открытым исходным кодом.

Архитектура и системные требования

В основе ERNIE-Image лежит архитектура Diffusion Transformer, объединяющая обработку текста и визуальных токенов в единую последовательность. Модель насчитывает 8 миллиардов параметров. Разработчики также предусмотрели режим ERNIE Image Turbo. Оптимизированная версия выдает готовый результат всего за 8 шагов вывода вместо стандартных 50, что ускоряет генерацию примерно в шесть раз.

ERNIE-Image

Несмотря на сложность архитектуры, инструмент отличается низким порогом входа. Базовая версия модели способна работать локально на потребительских графических ускорителях, оснащенных 24 ГБ видеопамяти (например, уровня RTX 3090 или RTX 4090), для чего вполне достаточно наших игровых компьютеров верхнего сегмента.

Преимущества для коммерческой разработки

Baidu распространяет ERNIE-Image по лицензии Apache 2.0, что допускает свободное коммерческое использование, модификацию и интеграцию алгоритма в сторонние продукты. Нейросеть поддерживает работу со средой ComfyUI, а также тонкую настройку через AI-Toolkit. Наличие открытых весов позволяет профильным специалистам дообучать модель под конкретные бизнес-задачи.

Запуск и дообучение современных генеративных моделей требует надежной вычислительной базы с большим объемом быстрой видеопамяти. Сбалансированные решения из категории серверов для ИИ гарантируют стабильную скорость генерации и отсутствие узких мест при длительных многопоточных вычислениях.

Для каких задач Компактный GPU-сервер до 2 видеокарт для начальных задач в AI и графике. Оптимален для инференса, визуализации, VFX и рендеринга в студиях и лабораториях, где важна гибкость.
Подробнее
Видеокарты
RTX / RTX PRO / H200 NVL
Объем видеопамяти до 282 ГБ
Процессоры
Threadripper PRO
Количество ядер до 96
RAM до 1024 ГБ DDR5
Форм-фактор 4.5U
Для каких задач Универсальная платформа на 4–6 GPU для локального обучения моделей и генеративных задач. Подходит для команд, которым важна надёжность сервера и свобода выбора графики — от RTX 5090 до PRO RTX 6000.
Подробнее
Видеокарты
RTX / RTX PRO / H200 NVL
Объем видеопамяти до 576 ГБ
Процессоры
Threadripper PRO
Количество ядер до 96
RAM до 1024 ГБ DDR5
Форм-фактор 6.5U
Для каких задач Сервер промышленного уровня на 8 GPU с кластерной архитектурой. Предназначен для дата-центров и AI-ферм, где требуется масштабируемость и полная загрузка ресурсов под обучение LLM и R&D.
Подробнее
Видеокарты
RTX PRO 6000 / RTX 5090
Объем видеопамяти до 768 ГБ
Процессоры
AMD Epyc, Intel Xeon
Количество ядер до 320
RAM до 3072 ГБ DDR5
Форм-фактор 6U
Для каких задач Серия серверов для кластеризации на 4 GPU. Предназначены для дата-центров и AI-ферм, где требуется повышенная плотность для обучение LLM и R&D.
Подробнее
Видеокарты
L40s / RTX PRO / H200 NVL
Объем видеопамяти до 564 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 128
RAM до 1536 ГБ DDR5
Форм-фактор 2U
Для каких задач Серия серверов для кластеризации на 8 GPU. Предназначены для дата-центров и AI-ферм, где требуется повышенная плотность для обучение LLM и R&D.
Подробнее
Видеокарты
L40s / RTX PRO / H200 NVL
Объем видеопамяти до 1128 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 256
RAM до 2048 ГБ DDR5
Форм-фактор 4U
Для каких задач HGX объединяет 8 видеокарт NVIDIA H200, достигая экстремальной плотности производительности. Благодаря внутренней связности NVSwitch мгновенно интегрируется в масштабные вычислительные кластеры.
Подробнее
Видеокарты
NVIDIA H200 SXM
Объем видеопамяти до 1128 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 256
RAM до 2048 ГБ DDR5
Форм-фактор 5U

Не пропусти главное в мире ПК

Мы публикуем последние новости из компьютерного мира. Подписывайся, чтобы быть в курсе и ничего не пропустить.

Подписаться 140к
Получите готовый ПК под свои задачи

Подберём ПК под ваши задачи, соберём, протестируем и доставим готовым к работе.

Собрать свой ПК
или свяжитесь с нами
Telegram Telegram WhatsApp WhatsApp ВКонтакте ВКонтакте MAX MAX
2.6К

Так же будет интересно почитать

Сайт использует cookies
Узнать подробнее