
ACE: AMD и Intel встроят ИИ-ускоритель в x86
Подберём сервер под задачи
Ответьте на несколько вопросов — подготовим предложение
AMD и Intel впервые за годы договорились о едином стандарте. ACE — это инструкции матричного ускорения для x86: процессор сам умножает матрицы, на которых держатся нейросети. Раньше этим занимался отдельный ускоритель. Заявка дерзкая — до шестнадцати раз выше плотность вычислений против нынешних векторных команд. Для бизнеса это ИИ-инференс на обычном процессоре, без видеокарты.
Краткое содержание
- ACE — общий для AMD и Intel стандарт матричного ускорения в x86, его согласовала группа x86 Ecosystem Advisory Group;
- восемь матричных регистров 16×16 и схема «внешнего произведения» дают до шестнадцати раз выше плотность вычислений против AVX10;
- нативно считает ИИ-форматы INT8, BF16, FP8 и масштабируемые MX-форматы (MXFP8, MXFP6, MXFP4) с блочным масштабированием;
- спецификация уже опубликована, первые процессоры — не раньше 2027 года; поддержку готовят в PyTorch, TensorFlow, NumPy и SciPy.
Что такое ACE и почему это важно
Умножение матриц — основная операция нейросетей и языковых моделей. У Intel под это давно есть расширение AMX, у AMD своего аналога не было: код под матричное ускорение приходилось писать по-разному или не использовать его вовсе. ACE закрывает разрыв — это один набор инструкций сразу для обеих архитектур.
Технически ACE добавляет в процессор восемь двумерных регистров-плиток размером 16×16. Считает он «внешним произведением»: за один проход берёт сразу все пересечения строк и столбцов, а не перебирает их по очереди, как обычные векторные команды. Отсюда и заявленный выигрыш — до шестнадцати раз выше плотность вычислений при том же объёме входных данных, что у AVX10. При этом ACE не конфликтует с AVX10, а работает в связке: векторные регистры идут на вход, плитки накапливают результат.
Что это даёт на практике
Главное для закупщика — ИИ-инференс на процессоре становится дешевле и реальнее. Небольшие модели, эмбеддинги, классический машинный анализ, рекомендательные системы можно гонять на CPU, не докупая видеокарту под каждую задачу. Там, где GPU избыточен, ACE снимает с него нагрузку.
Второй плюс — единый стандарт. Софт, написанный под ACE, одинаково пойдёт и на AMD, и на Intel: меньше привязки к конкретному производителю процессора при выборе сервера. Заодно x86 догоняет архитектуру ARM, где матричные расширения уже есть. А поддержка форматов FP4 и FP6 с блочным масштабированием поднимает пропускную способность инференса — лёгким моделям этого хватает с запасом.
Где подвох
Главный нюанс — сроки. Спецификация готова, но первых процессоров с ACE ждут не раньше 2027 года: у AMD это будущее ядро Zen 7, у Intel — следующие серверные Xeon. Купить такой процессор прямо сейчас нельзя.
И ACE не отменяет GPU. Тяжёлое обучение и большие языковые модели по-прежнему за ускорителями с сотнями гигабайт памяти — процессор с матричными командами их не заменит. ACE сужает разрыв на инференсе средней руки, а не переносит всю ИИ-нагрузку на CPU. Для российского рынка добавьте обычную задержку с поставками серверных новинок: реальная доступность сместится ещё дальше от анонса.
Мнение DigitalRazor
ACE — это сигнал на будущее, а не повод откладывать закупку. Нужен инференс сегодня — берите Xeon с AMX или GPU-сервер под конкретную модель, а ACE закладывайте в план обновления парка на 2027 год и дальше. Самое ценное здесь в том, что AMD и Intel впервые сошлись на одном наборе команд: софт перестанет зависеть от того, чей процессор стоит в сервере.













