
Qualcomm AI250: 768 ГБ LPDDR вместо HBM для ИИ
Подберём сервер под задачи
Ответьте на несколько вопросов — подготовим предложение
На дне инвесторов Qualcomm наконец раскрыла характеристики платформы Dragonfly — той самой, о которой в начале июня были одни намёки. Главная ставка оказалась в памяти: ускоритель AI250 несёт 768 гигабайт LPDDR прямо на карте и обходится без дорогой HBM. Расчёт — на инференс больших моделей, где упираются не в вычисления, а в объём и скорость памяти.
Краткое содержание
- AI250 (середина 2027 года) несёт 768 ГБ памяти LPDDR на карту — без HBM;
- в основе — технология High Bandwidth Compute: логика вычислений прямо под стеком памяти;
- заявлено 133 ТБ/с пропускной способности на карту — в 18 раз больше, чем у AI200;
- серверный процессор Dragonfly C1000 — более 250 ядер, PCIe Gen7, выход в 2028 году.
Главная ставка — LPDDR вместо HBM
Обычные ИИ-ускорители держат быструю память HBM рядом с чипом на дорогой подложке CoWoS. Это узкое место — и по цене, и по дефициту. Qualcomm зашла иначе. Технология High Bandwidth Compute ставит вычислительный кристалл прямо под стек памяти LPDDR и соединяет их плотными сквозными соединениями (TSV). Память переезжает на вычислитель, а не лежит рядом с ним.
Что это даёт по заявлению Qualcomm: 768 гигабайт памяти и 133 терабайта в секунду пропускной способности на одну карту — до шести раз выше пропускная способность на ватт, чем у нынешней HBM. Цифры пока никто не проверял независимо, но замысел понятен. LPDDR дешевле и доступнее HBM, а для инференса важнее уместить большую модель целиком, чем выжать пиковую скорость обучения.
Что показали по железу
Dragonfly — не один чип, а линейка с обновлением раз в год.
- ускоритель AI200 (конец 2026 года) — стартовая модель линейки;
- AI250 (середина 2027 года) — первый чип на High Bandwidth Compute: 768 ГБ LPDDR и 133 ТБ/с на карту;
- AI300 — следующий шаг, с HBC второго поколения и новыми интерфейсами связи ESUN и UALink;
- серверный процессор Dragonfly C1000 — более 250 ядер на архитектуре Oryon, частота выше 5 ГГц, PCIe Gen7 и CXL; выход во второй половине 2028 года.
Все ускорители заточены под инференс — запуск готовых моделей, а не их обучение. Qualcomm впервые назвала и заказчиков: о закупке серверных процессоров C1000 договорился один из крупнейших гиперскейлеров, о развёртывании ИИ-ускорителей на HBC заявила Microsoft. Программную платформу компания строит вокруг покупки Modular — это попытка дать альтернативу экосистеме CUDA.
Где подвох
Сроки. AI250 — это середина 2027 года, а серверный C1000 и вовсе 2028-й. На руках железа нет, есть дорожная карта и слайды. Дальше адресат: Qualcomm прямо говорит, что C1000 рассчитан на нескольких крупных заказчиков, то есть на гиперскейлеров, а не на массовый корпоративный рынок. Заявленные цифры по производительности и пропускной способности компания пока не подтвердила независимыми тестами. И главный риск любого нового ускорителя — софт: без зрелой экосистемы такой чип не запустишь так же просто, как привычные видеокарты. Для России добавляется вопрос поставок и параллельного импорта.
Мнение DigitalRazor
Ставка Qualcomm на LPDDR вместо HBM бьёт в реальную боль рынка — дефицит и цену памяти под ИИ. Если заявленные 768 гигабайт на карту подтвердятся на практике, это интересный вариант под инференс больших моделей, где важнее объём памяти, а не пиковая скорость. Но всё это 2027–2028 годы и прицел на гиперскейлеров. Сегодня под инференс мы собираем серверы на доступных GPU и считаем конфигурацию под вашу модель и бюджет, а Dragonfly держим на радаре.













