8 800 500-99-26 Для звонков по России
Qualcomm AI250: 768 ГБ LPDDR вместо HBM для ИИ
Железо
3 мин

Qualcomm AI250: 768 ГБ LPDDR вместо HBM для ИИ

DigitalRazor
DigitalRazor
Подписаться в Telegram
Содержание 4 раздела
Краткое содержание Главная ставка — LPDDR вместо HBM Что показали по железу Где подвох
Подберём сервер под вашу задачу

Подберём конфигурацию сервера и отправим предложение.

Смотреть серверы
или свяжитесь с нами
Telegram Telegram WhatsApp WhatsApp ВКонтакте ВКонтакте MAX MAX

Подберём сервер под задачи

Ответьте на несколько вопросов — подготовим предложение

На дне инвесторов Qualcomm наконец раскрыла характеристики платформы Dragonfly — той самой, о которой в начале июня были одни намёки. Главная ставка оказалась в памяти: ускоритель AI250 несёт 768 гигабайт LPDDR прямо на карте и обходится без дорогой HBM. Расчёт — на инференс больших моделей, где упираются не в вычисления, а в объём и скорость памяти.

Краткое содержание

  • AI250 (середина 2027 года) несёт 768 ГБ памяти LPDDR на карту — без HBM;
  • в основе — технология High Bandwidth Compute: логика вычислений прямо под стеком памяти;
  • заявлено 133 ТБ/с пропускной способности на карту — в 18 раз больше, чем у AI200;
  • серверный процессор Dragonfly C1000 — более 250 ядер, PCIe Gen7, выход в 2028 году.

Главная ставка — LPDDR вместо HBM

Обычные ИИ-ускорители держат быструю память HBM рядом с чипом на дорогой подложке CoWoS. Это узкое место — и по цене, и по дефициту. Qualcomm зашла иначе. Технология High Bandwidth Compute ставит вычислительный кристалл прямо под стек памяти LPDDR и соединяет их плотными сквозными соединениями (TSV). Память переезжает на вычислитель, а не лежит рядом с ним.

Что это даёт по заявлению Qualcomm: 768 гигабайт памяти и 133 терабайта в секунду пропускной способности на одну карту — до шести раз выше пропускная способность на ватт, чем у нынешней HBM. Цифры пока никто не проверял независимо, но замысел понятен. LPDDR дешевле и доступнее HBM, а для инференса важнее уместить большую модель целиком, чем выжать пиковую скорость обучения.

Что показали по железу

Dragonfly — не один чип, а линейка с обновлением раз в год.

  • ускоритель AI200 (конец 2026 года) — стартовая модель линейки;
  • AI250 (середина 2027 года) — первый чип на High Bandwidth Compute: 768 ГБ LPDDR и 133 ТБ/с на карту;
  • AI300 — следующий шаг, с HBC второго поколения и новыми интерфейсами связи ESUN и UALink;
  • серверный процессор Dragonfly C1000 — более 250 ядер на архитектуре Oryon, частота выше 5 ГГц, PCIe Gen7 и CXL; выход во второй половине 2028 года.

Все ускорители заточены под инференс — запуск готовых моделей, а не их обучение. Qualcomm впервые назвала и заказчиков: о закупке серверных процессоров C1000 договорился один из крупнейших гиперскейлеров, о развёртывании ИИ-ускорителей на HBC заявила Microsoft. Программную платформу компания строит вокруг покупки Modular — это попытка дать альтернативу экосистеме CUDA.

Где подвох

Сроки. AI250 — это середина 2027 года, а серверный C1000 и вовсе 2028-й. На руках железа нет, есть дорожная карта и слайды. Дальше адресат: Qualcomm прямо говорит, что C1000 рассчитан на нескольких крупных заказчиков, то есть на гиперскейлеров, а не на массовый корпоративный рынок. Заявленные цифры по производительности и пропускной способности компания пока не подтвердила независимыми тестами. И главный риск любого нового ускорителя — софт: без зрелой экосистемы такой чип не запустишь так же просто, как привычные видеокарты. Для России добавляется вопрос поставок и параллельного импорта.

Мнение DigitalRazor

Ставка Qualcomm на LPDDR вместо HBM бьёт в реальную боль рынка — дефицит и цену памяти под ИИ. Если заявленные 768 гигабайт на карту подтвердятся на практике, это интересный вариант под инференс больших моделей, где важнее объём памяти, а не пиковая скорость. Но всё это 2027–2028 годы и прицел на гиперскейлеров. Сегодня под инференс мы собираем серверы на доступных GPU и считаем конфигурацию под вашу модель и бюджет, а Dragonfly держим на радаре.

Для каких задач Компактный GPU-сервер до 2 видеокарт для начальных задач в AI и графике. Оптимален для инференса, визуализации, VFX и рендеринга в студиях и лабораториях, где важна гибкость.
Подробнее
Видеокарты
RTX / RTX PRO / H200 NVL
Объем видеопамяти до 282 ГБ
Процессоры
Threadripper PRO
Количество ядер до 96
RAM до 1024 ГБ DDR5
Форм-фактор 4.5U
Для каких задач Универсальная платформа на 4–6 GPU для локального обучения моделей и генеративных задач. Подходит для команд, которым важна надёжность сервера и свобода выбора графики — от RTX 5090 до PRO RTX 6000.
Подробнее
Видеокарты
RTX / RTX PRO / H200 NVL
Объем видеопамяти до 576 ГБ
Процессоры
Threadripper PRO
Количество ядер до 96
RAM до 1024 ГБ DDR5
Форм-фактор 6.5U
Для каких задач Сервер промышленного уровня на 8 GPU с кластерной архитектурой. Предназначен для дата-центров и AI-ферм, где требуется масштабируемость и полная загрузка ресурсов под обучение LLM и R&D.
Подробнее
Видеокарты
RTX PRO 6000 / RTX 5090
Объем видеопамяти до 768 ГБ
Процессоры
AMD Epyc, Intel Xeon
Количество ядер до 320
RAM до 3072 ГБ DDR5
Форм-фактор 6U
Для каких задач Серия серверов для кластеризации на 4 GPU. Предназначены для дата-центров и AI-ферм, где требуется повышенная плотность для обучение LLM и R&D.
Подробнее
Видеокарты
L40s / RTX PRO / H200 NVL
Объем видеопамяти до 564 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 128
RAM до 1536 ГБ DDR5
Форм-фактор 2U
Для каких задач Серия серверов для кластеризации на 8 GPU. Предназначены для дата-центров и AI-ферм, где требуется повышенная плотность для обучение LLM и R&D.
Подробнее
Видеокарты
L40s / RTX PRO / H200 NVL
Объем видеопамяти до 1128 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 256
RAM до 2048 ГБ DDR5
Форм-фактор 4U
Для каких задач HGX объединяет 8 видеокарт NVIDIA H200, достигая экстремальной плотности производительности. Благодаря внутренней связности NVSwitch мгновенно интегрируется в масштабные вычислительные кластеры.
Подробнее
Видеокарты
NVIDIA H200 SXM
Объем видеопамяти до 1128 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 256
RAM до 2048 ГБ DDR5
Форм-фактор 5U
Подберём сервер под вашу задачу

Подберём конфигурацию сервера и отправим предложение.

Смотреть серверы
или свяжитесь с нами
Telegram Telegram WhatsApp WhatsApp ВКонтакте ВКонтакте MAX MAX
9.2К

Так же будет интересно почитать

Сайт использует cookies
Узнать подробнее