
LineShine: 2,2 эксафлопса на Arm без GPU
Подберём сервер под задачи
Ответьте на несколько вопросов — подготовим предложение
Китайский суперкомпьютер LineShine возглавил свежий список TOP500 и первым в мире перешагнул отметку в два эксафлопса на тесте Linpack — 2,2 эксафлопса двойной точности. Самое интересное для рынка железа в другом: машина собрана целиком на серверных Arm-процессорах, без единого графического ускорителя. Считает не GPU, а 13,79 миллиона ядер.
Краткое содержание
- LineShine — первая система в TOP500, перешагнувшая два эксафлопса FP64, и сделано это без видеокарт;
- в основе — процессор LX2 на Armv9: 304 ядра, 32 ГБ памяти HBM прямо на кристалле и 256 ГБ DDR5;
- 60,3 терафлопса двойной точности на чип при 690 ваттах; в стойке — 512 процессоров и 30 петафлопсов FP64;
- вся система — 42 мегаватта и жидкостное охлаждение, а купить такой чип на открытом рынке нельзя.
Что внутри: процессор LX2
Сердце машины — серверный процессор LX2 на архитектуре Armv9. Это не переделанный мобильный чип, а тяжёлый вычислитель под научные расчёты.
- 304 ядра на процессор — два кристалла по 152 ядра, частота 1,55 гигагерца;
- векторные расширения SVE и SME — то, на чём держится быстрая математика двойной точности;
- 32 ГБ памяти HBM прямо в корпусе чипа плюс 256 ГБ обычной DDR5;
- 60,3 терафлопса FP64 и встроенная сеть на 800 гигабит в секунду на чип;
- тепловой пакет 690 ватт; в одной стойке — 512 таких процессоров и около 30 петафлопсов двойной точности.
Вся система — это 20 480 узлов по два LX2, 90 стоек и 13,79 миллиона ядер. Узлы связаны фирменной сетью LingQi на 1,6 терабита в секунду. Серверная основа, по данным аналитиков, — стойки Huawei Kunpeng.
Машина без GPU — почему это важно
Привычная картина последних лет: тяжёлые расчёты и ИИ держатся на видеокартах, процессор лишь подносит данные. LineShine показывает обратный сценарий. Здесь весь счёт идёт на ядрах Arm, а ключ к скорости — память HBM прямо на процессоре и широкие векторные блоки SVE и SME. Это возврат к старой идее «памяти впритык к ядрам», только на массовой серверной архитектуре.
Важна и оговорка про точность. Машина считает настоящий FP64 — двойную точность для инженерных и научных задач, а не урезанные ИИ-форматы, под которые затачивают современные ускорители. Для моделирования, физики и расчётов это принципиально: там, где нужна точность, низкие форматы не подходят.
Где подвох
Главное — этот процессор нельзя купить. LX2 не продаётся на открытом рынке, тем более в России: это железо для национального проекта, а не позиция в прайсе. Класс решения — гиперскейлер и государственный суперкомпьютер: 42 мегаватта на площадку и только жидкостное охлаждение. Своя специфика и у софта: код под Arm с расширениями SVE и SME нужно собирать и оптимизировать, готовой экосистемы уровня x86 здесь нет. Да и частота скромная, всего 1,55 гигагерца: скорость даёт не сама частота, а массовый параллелизм и быстрая память.
Мнение DigitalRazor
Читать эту новость как «пора брать Arm» не нужно — LX2 в свободную продажу не попадёт. Ценен сам урок инженерии: серверный процессор с памятью HBM на борту и широкими векторными блоками способен закрывать задачи, под которые раньше брали только видеокарты. Для реальных проектов под расчёты и ИИ мы по-прежнему собираем системы на доступных платформах — Xeon, EPYC и GPU-узлах, — но держим в уме, что архитектура CPU быстро смещается в сторону «тяжёлой математики прямо в процессоре».













