8 800 500-99-26 Для звонков по России
LineShine: 2,2 эксафлопса на Arm без GPU
Железо
3 мин

LineShine: 2,2 эксафлопса на Arm без GPU

DigitalRazor
DigitalRazor
Подписаться в Telegram
Содержание 4 раздела
Краткое содержание Что внутри: процессор LX2 Машина без GPU — почему это важно Где подвох
Подберём сервер под вашу задачу

Подберём конфигурацию сервера и отправим предложение.

Смотреть серверы
или свяжитесь с нами
Telegram Telegram WhatsApp WhatsApp ВКонтакте ВКонтакте MAX MAX

Подберём сервер под задачи

Ответьте на несколько вопросов — подготовим предложение

Китайский суперкомпьютер LineShine возглавил свежий список TOP500 и первым в мире перешагнул отметку в два эксафлопса на тесте Linpack — 2,2 эксафлопса двойной точности. Самое интересное для рынка железа в другом: машина собрана целиком на серверных Arm-процессорах, без единого графического ускорителя. Считает не GPU, а 13,79 миллиона ядер.

Краткое содержание

  • LineShine — первая система в TOP500, перешагнувшая два эксафлопса FP64, и сделано это без видеокарт;
  • в основе — процессор LX2 на Armv9: 304 ядра, 32 ГБ памяти HBM прямо на кристалле и 256 ГБ DDR5;
  • 60,3 терафлопса двойной точности на чип при 690 ваттах; в стойке — 512 процессоров и 30 петафлопсов FP64;
  • вся система — 42 мегаватта и жидкостное охлаждение, а купить такой чип на открытом рынке нельзя.

Что внутри: процессор LX2

Сердце машины — серверный процессор LX2 на архитектуре Armv9. Это не переделанный мобильный чип, а тяжёлый вычислитель под научные расчёты.

  • 304 ядра на процессор — два кристалла по 152 ядра, частота 1,55 гигагерца;
  • векторные расширения SVE и SME — то, на чём держится быстрая математика двойной точности;
  • 32 ГБ памяти HBM прямо в корпусе чипа плюс 256 ГБ обычной DDR5;
  • 60,3 терафлопса FP64 и встроенная сеть на 800 гигабит в секунду на чип;
  • тепловой пакет 690 ватт; в одной стойке — 512 таких процессоров и около 30 петафлопсов двойной точности.

Вся система — это 20 480 узлов по два LX2, 90 стоек и 13,79 миллиона ядер. Узлы связаны фирменной сетью LingQi на 1,6 терабита в секунду. Серверная основа, по данным аналитиков, — стойки Huawei Kunpeng.

Машина без GPU — почему это важно

Привычная картина последних лет: тяжёлые расчёты и ИИ держатся на видеокартах, процессор лишь подносит данные. LineShine показывает обратный сценарий. Здесь весь счёт идёт на ядрах Arm, а ключ к скорости — память HBM прямо на процессоре и широкие векторные блоки SVE и SME. Это возврат к старой идее «памяти впритык к ядрам», только на массовой серверной архитектуре.

Важна и оговорка про точность. Машина считает настоящий FP64 — двойную точность для инженерных и научных задач, а не урезанные ИИ-форматы, под которые затачивают современные ускорители. Для моделирования, физики и расчётов это принципиально: там, где нужна точность, низкие форматы не подходят.

Где подвох

Главное — этот процессор нельзя купить. LX2 не продаётся на открытом рынке, тем более в России: это железо для национального проекта, а не позиция в прайсе. Класс решения — гиперскейлер и государственный суперкомпьютер: 42 мегаватта на площадку и только жидкостное охлаждение. Своя специфика и у софта: код под Arm с расширениями SVE и SME нужно собирать и оптимизировать, готовой экосистемы уровня x86 здесь нет. Да и частота скромная, всего 1,55 гигагерца: скорость даёт не сама частота, а массовый параллелизм и быстрая память.

Мнение DigitalRazor

Читать эту новость как «пора брать Arm» не нужно — LX2 в свободную продажу не попадёт. Ценен сам урок инженерии: серверный процессор с памятью HBM на борту и широкими векторными блоками способен закрывать задачи, под которые раньше брали только видеокарты. Для реальных проектов под расчёты и ИИ мы по-прежнему собираем системы на доступных платформах — Xeon, EPYC и GPU-узлах, — но держим в уме, что архитектура CPU быстро смещается в сторону «тяжёлой математики прямо в процессоре».

Для каких задач Компактный GPU-сервер до 2 видеокарт для начальных задач в AI и графике. Оптимален для инференса, визуализации, VFX и рендеринга в студиях и лабораториях, где важна гибкость.
Подробнее
Видеокарты
RTX / RTX PRO / H200 NVL
Объем видеопамяти до 282 ГБ
Процессоры
Threadripper PRO
Количество ядер до 96
RAM до 1024 ГБ DDR5
Форм-фактор 4.5U
Для каких задач Универсальная платформа на 4–6 GPU для локального обучения моделей и генеративных задач. Подходит для команд, которым важна надёжность сервера и свобода выбора графики — от RTX 5090 до PRO RTX 6000.
Подробнее
Видеокарты
RTX / RTX PRO / H200 NVL
Объем видеопамяти до 576 ГБ
Процессоры
Threadripper PRO
Количество ядер до 96
RAM до 1024 ГБ DDR5
Форм-фактор 6.5U
Для каких задач Сервер промышленного уровня на 8 GPU с кластерной архитектурой. Предназначен для дата-центров и AI-ферм, где требуется масштабируемость и полная загрузка ресурсов под обучение LLM и R&D.
Подробнее
Видеокарты
RTX PRO 6000 / RTX 5090
Объем видеопамяти до 768 ГБ
Процессоры
AMD Epyc, Intel Xeon
Количество ядер до 320
RAM до 3072 ГБ DDR5
Форм-фактор 6U
Для каких задач Серия серверов для кластеризации на 4 GPU. Предназначены для дата-центров и AI-ферм, где требуется повышенная плотность для обучение LLM и R&D.
Подробнее
Видеокарты
L40s / RTX PRO / H200 NVL
Объем видеопамяти до 564 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 128
RAM до 1536 ГБ DDR5
Форм-фактор 2U
Для каких задач Серия серверов для кластеризации на 8 GPU. Предназначены для дата-центров и AI-ферм, где требуется повышенная плотность для обучение LLM и R&D.
Подробнее
Видеокарты
L40s / RTX PRO / H200 NVL
Объем видеопамяти до 1128 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 256
RAM до 2048 ГБ DDR5
Форм-фактор 4U
Для каких задач HGX объединяет 8 видеокарт NVIDIA H200, достигая экстремальной плотности производительности. Благодаря внутренней связности NVSwitch мгновенно интегрируется в масштабные вычислительные кластеры.
Подробнее
Видеокарты
NVIDIA H200 SXM
Объем видеопамяти до 1128 ГБ
Процессоры
AMD EPYC, Intel Xeon
Количество ядер до 256
RAM до 2048 ГБ DDR5
Форм-фактор 5U
Подберём сервер под вашу задачу

Подберём конфигурацию сервера и отправим предложение.

Смотреть серверы
или свяжитесь с нами
Telegram Telegram WhatsApp WhatsApp ВКонтакте ВКонтакте MAX MAX
3.7К

Так же будет интересно почитать

Сайт использует cookies
Узнать подробнее