
Агентный ИИ: счёт идёт на ядра, а не на видеокарты
Подберём игровой ПК за 2 шага
Ответьте на несколько вопросов — покажем готовые сборки
Принято считать, что искусственный интеллект — это видеокарты. У агентного ИИ есть и вторая половина, о которой говорят реже: сами агенты, их оркестровка, базы данных и веб-сервисы работают на обычных процессорах. Когда программных агентов в инфраструктуре становится больше, чем живых пользователей, узким местом становятся не видеокарты, а серверные ядра.
Краткое содержание
- инференс модели живёт на ускорителе, но всё вокруг агента — фреймворк, скрипты, базы, веб — это работа для процессора;
- запросов от программных агентов уже примерно столько же, сколько от людей, и счёт по ядрам растёт незаметно;
- рабочая лошадка под такой фронт — плотный двухсокетный узел: Dell PowerEdge R7725 несёт до 384 ядер EPYC Turin в 2U;
- парк считают по ядрам, памяти и питанию стойки, а не только по числу видеокарт.
Где у агента прячется работа для процессора
Разговор с языковой моделью и правда идёт на ускорителе — нередко вообще через чужой API. А вот всё вокруг этого вызова держит процессор. Фреймворк агента принимает задачу, режет её на шаги, дёргает инструменты, ходит в базы и очереди, поднимает веб-сервисы и песочницы под каждый запуск. Чем самостоятельнее агент, тем больше таких операций — и считаются они на ядрах, а не в видеопамяти.
Добавьте повторные попытки. Даже у сильных моделей часть ответов приходит в неверном формате, и примерно четверть рабочих цепочек уходит на повторный круг. Каждый круг — снова процессорное время: разобрать ответ, проверить, переформулировать, выполнить. А у агента ещё и тайм-аут: ответ нужен быстро, иначе сценарий рвётся.
Чем закрывают этот фронт: плотный узел на двух EPYC
Раз нагрузка ушла на ядра, под неё берут максимально плотные процессорные узлы. Типичная рабочая лошадка — двухсокетный сервер вроде Dell PowerEdge R7725 на процессорах AMD EPYC Turin. В корпусе высотой 2U помещается до 384 ядер — в полтора раза больше, чем у прошлого поколения той же платформы.
- два процессора AMD EPYC 9005 (Turin), до 192 ядер каждый — суммарно до 384 ядер в 2U;
- 24 слота под память, до 6 терабайт DDR5-6400 на сервер, по 12 каналов на сокет;
- 128 линий PCIe 5.0 на процессор, до восьми слотов расширения и до 40 накопителей NVMe формата E3.S;
- тепловой пакет до 500 ватт на сокет — это уже разговор про плотное охлаждение стойки.
Где подвох
Плотность по ядрам не бесплатна. Два процессора по 500 ватт плюс память и диски — это под киловатт на узел, и стойку из таких серверов считают по питанию и теплу заранее. Дальше — выбор самих чипов: под агентов нужны не редкие ядра с высокой частотой, а массовые и экономичные, где выигрывает число потоков на ватт. И главное — видеокарты никто не отменял. Это не «процессор вместо видеокарты», а трезвый расчёт обеих половин: сколько ускорителей под инференс и сколько ядер под всё остальное.
Мнение DigitalRazor
Парк под агентную инфраструктуру считайте сразу по двум осям: ускорители под инференс и серверные ядра под оркестровку, базы и веб. Вторую часто недооценивают — видеокарты куплены, а узким местом становится процессорный узел. Двухсокетная платформа на EPYC Turin закрывает этот фронт с запасом; поможем подобрать конфигурацию по числу ядер, памяти и питанию стойки под задачу.
Не пропусти главное в мире ПК
Мы публикуем последние новости из компьютерного мира. Подписывайся, чтобы быть в курсе и ничего не пропустить.















