8 800 500-99-26 Для звонков по России
Конец эпохи GPU: стартап Taalas вшил ИИ-модель прямо в кремний
Конец эпохи GPU: стартап Taalas вшил ИИ-модель прямо в кремний
Олег Олегович Олег Олегович
Новости

Конец эпохи GPU: стартап Taalas вшил ИИ-модель прямо в кремний

3 мин
Подписаться в Telegram

Содержание

  1. Краткое содержание
  2. Модель — это и есть компьютер
  3. Убийца NVIDIA и Cerebras
  4. Что это значит для индустрии
  5. Есть нюанс

Не знаете, какой ПК взять?

Ответьте на несколько вопросов — получите готовую сборку с ценой.

Канадский стартап Taalas вышел из тени с громким анонсом, который может перевернуть всю индустрию искусственного интеллекта. Разработчики представили революционный подход: вместо того, чтобы обрабатывать ИИ-модели программно на универсальных видеокартах, они предлагают физически вшивать их в структуру чипа. Это делает вычисления невероятно быстрыми и дешёвыми.

Краткое содержание

  • Стартап Taalas физически встроил популярную языковую модель Llama 3.1 в слои кремниевого чипа;
  • Новые процессоры работают в десятки раз быстрее флагманских решений от NVIDIA и аналогов;
  • Инженеры полностью отказались от использования видеопамяти HBM, что существенно снижает стоимость производства;
  • Кластер из 30 чипов успешно запускает модель DeepSeek R1, выдавая 12 000 токенов в секунду.

Модель — это и есть компьютер

Современный искусственный интеллект полагается на мощные универсальные графические процессоры. В новых чипах инженеры физически выгравировали веса нейросети в верхних слоях металла. Исчезла универсальность, зато появилась специализация. Вычисления и хранение данных теперь происходят в одном месте. Никакой внешней памяти, никакой HBM и никакого интерфейса CUDA.

Генеральный директор компании Любиша Баджич утверждает, что этот подход отлично работает. Процесс превращения любой новой ИИ-модели в готовое аппаратное решение занимает у инженеров стартапа всего около двух месяцев. В условиях, когда надвигающийся дефицит памяти может привести к банкротству многих компаний, такой полный отказ от использования чипов HBM выглядит невероятно дальновидным стратегическим шагом.

Убийца NVIDIA и Cerebras

Первые тесты чипа HC1 с «зашитой» моделью на 8 миллиардов параметров демонстрируют феноменальные результаты. Устройство генерирует 17 тысяч токенов в секунду для одного пользователя. Это в 10 раз быстрее, чем у передового «мегачипа» Cerebras, и в 20–50 раз быстрее, чем у флагманских ускорителей NVIDIA H200 или B200 в однопоточных сценариях.

Taalas

При этом новинка потребляет в 10 раз меньше энергии, а её производство обходится в 20 раз дешевле традиционных видеокарт. Себестоимость вывода данных падает до 0,75 цента за миллион токенов. Для сравнения: на классических GPU эта цифра варьируется от 20 до 49 центов.

Важно понимать, что технология Taalas подходит исключительно для инференса уже готовых нейросетей. Если ты планируешь обучать собственные генеративные модели с нуля или заниматься сложными математическими вычислениями, по-прежнему понадобятся классические вычислительные мощности. Для этих целей отлично подойдут наши GPU-серверы, которые без проблем справятся с любыми круглосуточными нагрузками при машинном обучении.

Что это значит для индустрии

Планы у канадцев поистине грандиозные. До конца 2026 года они намерены выпустить ещё две новые аппаратные модели. Если их стратегия сработает, текущий пузырь искусственного интеллекта лопнет, а генерация текста и кода станет значительно дешевле электричества.

Taalas

К сожалению, менее «шакальной» картинки нет

Хочешь собрать мощный компьютер для работы с локальными нейросетями уже сегодня, не дожидаясь, пока новые революционные технологии доберутся до масс-маркета? Заходи в наш конфигуратор ПК и выбирай оптимальное железо под свои задачи, а наши технические эксперты помогут сделать всё в лучшем виде.

Есть нюанс

Здесь есть важная деталь. Оригинальный Taalas HC1 адаптирован под относительно небольшую Llama 3.1 (8 миллиардов параметров). Для работы с современными моделями, масштаб которых достигает триллионов параметров, инженеры предлагают масштабировать производительность за счёт создания кластеров. Подход уже доказал свою эффективность: массив из 30 процессоров смог запустить DeepSeek R1 на скорости в 12 000 транзакций в секунду. При таких показателях экономии проект ждёт большое будущее.

Не пропусти главное в мире ПК

Мы публикуем последние новости из компьютерного мира. Подписывайся, чтобы быть в курсе и ничего не пропустить.

Подписаться 137к
9.9К

Так же будет интересно почитать

Сайт использует cookies
Узнать подробнее