

Конец эпохи GPU: стартап Taalas вшил ИИ-модель прямо в кремний
Содержание
Не знаете, какой ПК взять?
Ответьте на несколько вопросов — получите готовую сборку с ценой.
Канадский стартап Taalas вышел из тени с громким анонсом, который может перевернуть всю индустрию искусственного интеллекта. Разработчики представили революционный подход: вместо того, чтобы обрабатывать ИИ-модели программно на универсальных видеокартах, они предлагают физически вшивать их в структуру чипа. Это делает вычисления невероятно быстрыми и дешёвыми.
Краткое содержание
- Стартап Taalas физически встроил популярную языковую модель Llama 3.1 в слои кремниевого чипа;
- Новые процессоры работают в десятки раз быстрее флагманских решений от NVIDIA и аналогов;
- Инженеры полностью отказались от использования видеопамяти HBM, что существенно снижает стоимость производства;
- Кластер из 30 чипов успешно запускает модель DeepSeek R1, выдавая 12 000 токенов в секунду.
Модель — это и есть компьютер
Современный искусственный интеллект полагается на мощные универсальные графические процессоры. В новых чипах инженеры физически выгравировали веса нейросети в верхних слоях металла. Исчезла универсальность, зато появилась специализация. Вычисления и хранение данных теперь происходят в одном месте. Никакой внешней памяти, никакой HBM и никакого интерфейса CUDA.
Генеральный директор компании Любиша Баджич утверждает, что этот подход отлично работает. Процесс превращения любой новой ИИ-модели в готовое аппаратное решение занимает у инженеров стартапа всего около двух месяцев. В условиях, когда надвигающийся дефицит памяти может привести к банкротству многих компаний, такой полный отказ от использования чипов HBM выглядит невероятно дальновидным стратегическим шагом.
Убийца NVIDIA и Cerebras
Первые тесты чипа HC1 с «зашитой» моделью на 8 миллиардов параметров демонстрируют феноменальные результаты. Устройство генерирует 17 тысяч токенов в секунду для одного пользователя. Это в 10 раз быстрее, чем у передового «мегачипа» Cerebras, и в 20–50 раз быстрее, чем у флагманских ускорителей NVIDIA H200 или B200 в однопоточных сценариях.

При этом новинка потребляет в 10 раз меньше энергии, а её производство обходится в 20 раз дешевле традиционных видеокарт. Себестоимость вывода данных падает до 0,75 цента за миллион токенов. Для сравнения: на классических GPU эта цифра варьируется от 20 до 49 центов.
Важно понимать, что технология Taalas подходит исключительно для инференса уже готовых нейросетей. Если ты планируешь обучать собственные генеративные модели с нуля или заниматься сложными математическими вычислениями, по-прежнему понадобятся классические вычислительные мощности. Для этих целей отлично подойдут наши GPU-серверы, которые без проблем справятся с любыми круглосуточными нагрузками при машинном обучении.
Что это значит для индустрии
Планы у канадцев поистине грандиозные. До конца 2026 года они намерены выпустить ещё две новые аппаратные модели. Если их стратегия сработает, текущий пузырь искусственного интеллекта лопнет, а генерация текста и кода станет значительно дешевле электричества.

К сожалению, менее «шакальной» картинки нет
Хочешь собрать мощный компьютер для работы с локальными нейросетями уже сегодня, не дожидаясь, пока новые революционные технологии доберутся до масс-маркета? Заходи в наш конфигуратор ПК и выбирай оптимальное железо под свои задачи, а наши технические эксперты помогут сделать всё в лучшем виде.
Есть нюанс
Здесь есть важная деталь. Оригинальный Taalas HC1 адаптирован под относительно небольшую Llama 3.1 (8 миллиардов параметров). Для работы с современными моделями, масштаб которых достигает триллионов параметров, инженеры предлагают масштабировать производительность за счёт создания кластеров. Подход уже доказал свою эффективность: массив из 30 процессоров смог запустить DeepSeek R1 на скорости в 12 000 транзакций в секунду. При таких показателях экономии проект ждёт большое будущее.
Не пропусти главное в мире ПК
Мы публикуем последние новости из компьютерного мира. Подписывайся, чтобы быть в курсе и ничего не пропустить.




