
Napier: ускоритель на логарифмах бросает вызов NVIDIA
Подберём сервер под задачи
Ответьте на несколько вопросов — подготовим предложение
Стартап Tensordyne показал Napier — ИИ-ускоритель, который считает не как все. Вместо привычного умножения чисел он работает на логарифмах: умножение превращается в сложение, а оно дешевле и по площади кристалла, и по энергии. Освободившееся место отдали под сверхбыструю память. Заявка дерзкая — потеснить NVIDIA на инференсе больших моделей.
Краткое содержание
- логарифмическая математика: умножение превращается в сложение, а сумматоры меньше и экономичнее множителей;
- 256 МБ памяти SRAM на кристалле (по заявлению — впятеро больше, чем у NVIDIA Blackwell) и 144 ГБ HBM3E;
- техпроцесс TSMC 3 нм, 138 млрд транзисторов, ставка только на инференс больших моделей;
- воздушное охлаждение стойки при 120 кВт; бета — начало 2027 года, поставки — к середине 2027-го.
Как считать на логарифмах и зачем
Обычный ускоритель тратит большую часть кремния на блоки умножения — именно умножения матриц лежат в основе нейросетей. Tensordyne зашла с другой стороны. В логарифмической системе счисления умножение двух чисел превращается в сложение их логарифмов, а сумматор по площади и энергопотреблению в разы скромнее умножителя. Высвобожденное место инженеры пустили под память прямо на кристалле.
Результат — 256 МБ сверхбыстрой памяти SRAM в самом чипе. По заявлению Tensordyne, это впятеро больше, чем у NVIDIA Blackwell. Для инференса больших моделей такой запас дорогого стоит: чем больше данных лежит рядом с вычислителем, тем реже приходится ходить во внешнюю память и тем выше реальная скорость.
Что на кристалле и в стойке
Napier — это не только арифметический трюк, но и плотная начинка. Ключевые цифры одного чипа:
- техпроцесс TSMC 3 нм, 138 млрд транзисторов;
- 2,1 петафлопса на кристалл, тактовая частота ускорителя 1,33 ГГц;
- 256 МБ памяти SRAM и 144 ГБ памяти HBM3E на чип;
- фирменная межчиповая связь TDN Link с задержкой меньше микросекунды.
Из чипов собирается стоечная система TDN72: 42 ТБ HBM3E и около 120 кВт на стойку. Любопытно, что охлаждение здесь воздушное, а не жидкостное — нетипично для такой плотности. Управляющие процессоры — Intel Xeon; шасси и часть инфраструктуры делает HPE, а вывести 3-нанометровый кристалл на TSMC помог Broadcom.
Где подвох: софт, сроки и поставки
Главный вопрос — не железо, а программная экосистема. У NVIDIA есть CUDA, под которую написано почти всё в мире ИИ. Tensordyne предлагает свой набор инструментов, компиляцию из PyTorch и собственный язык, но переучивать команды и переносить готовый стек — отдельная работа, и она может оказаться дороже самого ускорителя.
Второй момент — сроки. Пока это только изготовленный кристалл и дорожная карта: бета-программы намечены на начало 2027 года, поставки систем — к середине 2027-го. Эффектные сравнения с NVIDIA и Groq, которыми компания размахивает на старте, — пока маркетинговые обещания без независимых замеров. Для российского закупщика добавляется третий слой: это венчурный американский продукт, и легальная поставка в РФ под большим вопросом.
Мнение DigitalRazor
Napier интересен как сигнал: рынок ИИ-ускорителей перестаёт быть вотчиной одного вендора, а нестандартный подход к арифметике даёт реальную экономию по площади и питанию. Но это история 2027 года и пока без зрелой экосистемы, поэтому ставить на неё закупку рано. Тем, кому инференс нужен сейчас, мы собираем проверенные GPU-серверы под конкретную модель и бюджет — с понятными сроками и поддержкой.














