8 800 500-99-26 Для звонков по России
OpenAI Jalapeño: первый свой чип против NVIDIA
Железо
2 мин

OpenAI Jalapeño: первый свой чип против NVIDIA

DigitalRazor
DigitalRazor
Подписаться в Telegram
Содержание 4 раздела
Краткое содержание Что это за чип и кто его собрал Зачем своей компании свой чип Где подвох
Подберём сервер под вашу задачу

Подберём конфигурацию сервера и отправим предложение.

Смотреть серверы
или свяжитесь с нами
Telegram Telegram WhatsApp WhatsApp ВКонтакте ВКонтакте MAX MAX

Подберём сервер под задачи

Ответьте на несколько вопросов — подготовим предложение

OpenAI впервые сделала собственный чип. Jalapeño — ИИ-ускоритель под инференс больших языковых моделей, спроектированный с нуля вместе с Broadcom. Смысл прямой: гонять свои модели на своём железе, а не только на видеокартах NVIDIA. Чип уже работает в лаборатории, первые развёртывания обещают до конца 2026 года.

Краткое содержание

  • первый собственный чип OpenAI — ИИ-ускоритель Jalapeño под инференс, спроектирован вместе с Broadcom;
  • техпроцесс TSMC 3 нм, большой вычислительный кристалл со стеками памяти HBM3E, сеть на Broadcom Tomahawk;
  • от первых чертежей до готовности к выпуску — девять месяцев, и в этом помогали сами модели OpenAI;
  • инференс заявлен примерно вдвое дешевле, чем на нынешних GPU; первые развёртывания — конец 2026 года.

Что это за чип и кто его собрал

Jalapeño — заказной ASIC, то есть чип под одну задачу. Задача здесь — инференс, запуск готовых больших языковых моделей. OpenAI проектировала его под свои модели, Broadcom отвечала за реализацию кремния и связь между чипами, а платы, стойки и сборку систем взяла на себя Celestica.

  • техпроцесс TSMC 3 нм, большой вычислительный кристалл, по бокам — стеки быстрой памяти HBM3E;
  • сеть на кристалле — Broadcom Tomahawk: ускорители объединяются в кластеры на сотни чипов;
  • заточен только под инференс, а не под обучение — это не универсальный ускоритель;
  • от чертежей до готовности к выпуску — девять месяцев, и OpenAI называет это рекордно быстрым циклом для такого чипа.

Зачем своей компании свой чип

Логика простая — деньги и независимость. Инференс больших моделей идёт круглосуточно, и счёт за видеокарты NVIDIA растёт быстрее всего остального. Чип под собственные модели обещает примерно вдвое более дешёвый инференс — так оценивает глава Broadcom. Если цифра подтвердится, экономика обслуживания моделей меняется заметно. Заодно OpenAI перестаёт зависеть от одного поставщика ускорителей и собирает весь стек под себя, от модели до железа.

Любопытен и сам способ разработки: проектирование ускоряли собственными моделями OpenAI. То есть ИИ помогал делать железо для ИИ. По заявленной производительности на инференсе Jalapeño ставят в один ряд с топовыми NVIDIA Blackwell и Google TPU, но это пока слова вендоров, а не независимые замеры.

Где подвох

Главное — этот чип не купить. Jalapeño живёт в дата-центрах самой OpenAI и рассчитан на её гигаваттные мощности, а не на корпоративную стойку. Это история про то, куда движется рынок, а не про железку в прайс-листе. Дальше — цифры: и экономия около половины, и паритет с Blackwell заявлены самими разработчиками, независимых тестов пока нет. Точные характеристики — число ядер, объём памяти, энергопотребление — не раскрыты. И сроки: в лаборатории чип уже считает, но первые развёртывания обещают только к концу 2026 года, а масштаб в десять гигаватт — это 2029-й.

Мнение DigitalRazor

Своя кремниевая платформа у OpenAI — сигнал для всего рынка: даже крупнейшие игроки уходят от монокультуры видеокарт NVIDIA ради цены инференса. Но Jalapeño не купить, это железо под собственные дата-центры OpenAI. Бизнесу из этого важен один вывод: инференс пора считать по стоимости запуска, а не по престижу чипа. Под вашу модель мы и сегодня соберём сервер на доступных GPU и подберём конфигурацию под бюджет, а альтернативные ускорители держим на радаре.

Для каких задач Компактный GPU-сервер до 2 видеокарт для начальных задач в AI и графике. Оптимален для инференса, визуализации, VFX и рендеринга в студиях и лабораториях, где важна гибкость.
Подробнее
Видеокарты
RTX / RTX PRO / H200 NVL
Объем видеопамяти до 282 ГБ
Процессоры
Threadripper PRO
Количество ядер до 96
RAM до 1024 ГБ DDR5
Форм-фактор 4.5U
Для каких задач Универсальная платформа на 4–6 GPU для локального обучения моделей и генеративных задач. Подходит для команд, которым важна надёжность сервера и свобода выбора графики — от RTX 5090 до PRO RTX 6000.
Подробнее
Видеокарты
RTX / RTX PRO / H200 NVL
Объем видеопамяти до 576 ГБ
Процессоры
Threadripper PRO
Количество ядер до 96
RAM до 1024 ГБ DDR5
Форм-фактор 6.5U
Для каких задач Сервер промышленного уровня на 8 GPU с кластерной архитектурой. Предназначен для дата-центров и AI-ферм, где требуется масштабируемость и полная загрузка ресурсов под обучение LLM и R&D.
Подробнее
Видеокарты
RTX PRO 6000 / RTX 5090
Объем видеопамяти до 768 ГБ
Процессоры
AMD Epyc, Intel Xeon
Количество ядер до 320
RAM до 3072 ГБ DDR5
Форм-фактор 6U
Для каких задач Серия серверов для кластеризации на 4 GPU. Предназначены для дата-центров и AI-ферм, где требуется повышенная плотность для обучение LLM и R&D.
Подробнее
Видеокарты
L40s / RTX PRO / H200 NVL
Объем видеопамяти до 564 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 128
RAM до 1536 ГБ DDR5
Форм-фактор 2U
Для каких задач Серия серверов для кластеризации на 8 GPU. Предназначены для дата-центров и AI-ферм, где требуется повышенная плотность для обучение LLM и R&D.
Подробнее
Видеокарты
L40s / RTX PRO / H200 NVL
Объем видеопамяти до 1128 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 256
RAM до 2048 ГБ DDR5
Форм-фактор 4U
Для каких задач HGX объединяет 8 видеокарт NVIDIA H200, достигая экстремальной плотности производительности. Благодаря внутренней связности NVSwitch мгновенно интегрируется в масштабные вычислительные кластеры.
Подробнее
Видеокарты
NVIDIA H200 SXM
Объем видеопамяти до 1128 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 256
RAM до 2048 ГБ DDR5
Форм-фактор 5U
Подберём сервер под вашу задачу

Подберём конфигурацию сервера и отправим предложение.

Смотреть серверы
или свяжитесь с нами
Telegram Telegram WhatsApp WhatsApp ВКонтакте ВКонтакте MAX MAX
9.3К

Так же будет интересно почитать

Сайт использует cookies
Узнать подробнее