8 800 500-99-26 Для звонков по России
DigitalRazor
Статьи

Как запустить GPT-oss локально: инструкция для «чайников»

На днях OpenAI выпустила GPT-oss — сразу две ИИ-модели с открытым исходным кодом. Среди ключевых особенностей — полностью бесплатное распространение, возможность редактировать код под свои задачи, а также работа в локальном режиме. Детальнее об этом мы уже рассказывали здесь.

В этом материале расписываем по пунктам, как запустить GPT-oss полностью локально, и что для этого потребуется.

GPT-oss в двух словах

С 2019 года, со времён GPT-2, продукция компании OpenAI закрытая. Отладку контролируют только разработчики, а у пользователей и администраторов нет возможности посмотреть исходный код. Также неизвестно, каким образом происходило обучение. Иными словами, как GPT устроены «под капотом» общественности неизвестно.

Общие преимущества

  • Возможность локального запуска;
  • Полностью бесплатная схема распространения, в том числе для коммерческого использования;
  • Открытый исходный код. Как следствие — 100% безопасность данных;
  • Есть режим рассуждения;
  • Полная поддержка русского языка.

Версии

  • GPT-oss-120b — тяжеловесная версия на 120 млрд параметров. Занимает 64 ГБ дискового пространства;
  • GPT-oss-20b — упрощённая версия на 20 млрд параметров. Менее точная и развитая. Требуется 12 ГБ на диске.

Системные требования

О системных требованиях OpenAI рассказала очень размыто. Младшей версии достаточно ноутбука с 16 ГБ оперативной памяти, старшей требуется видеокарта с 80 ГБ видеопамяти или аналогичное количество оперативки.

Отдельно отметим, что это не «минималки», а рекомендуемые. На более слабых системах работать будет, но медленнее.

По-простому говоря, если GPT-oss-20b достаточно хиленького игрового ПК, то для GPT-oss-120b потребуется неслабая рабочая станция. Мы подготовили несколько специализированных решений для локального запуска. Впрочем, владельцы приличных игровых ПК тоже могут попробовать

GPT-oss: как запустить

Чтобы «поднять» локальный ИИ, не требуются продвинутые навыки программирования и умение работать с командной строкой. Мы рассмотрим процесс на примере популярной платформы LM Studio с удобным графическим интерфейсом.

Шаг 1 — установка LM Studio

  • Скачать приложение LM Studio здесь(это бесплатно);
  • Установить и запустить программу;
  • Желательно сразу в нижней левой части экрана выбрать режим «Developer», который открывает дополнительные функциональные возможности;
  • Желательно в правой нижней части нажать на «шестерёнку» и для простоты восприятия выбрать русский язык (перевод частичный).

Шаг 2 — добавляем модель

Поскольку GPT-oss — большая новинка, LM Studio сразу предложит установить GPT-oss-20b. Можете так и сделать, но мы покажем большой путь.

  • В левой части нажать на лупу (кнопка «Обзор моделей»);
  • В появившемся списке выбрать GPT-oss-20b или GPT-oss-120b, после чего нажать «Download»;
  • Дождаться окончания загрузки и установки (это происходит автоматически).

60 МБ в секунду — качается быстро

LM Studio сразу показывает, будет ли работать модель на конкретной конфигурации компьютера. В случае тестового ПК с GeForce RTX 5080 LM Studio говорит, что oss-20b целиком поместится в видеопамять и будет работать просто замечательно, а вот для GPT-oss-120b видеопамяти маловато. В нашем случае оперативной памяти тоже недостаточно.

Шаг 3 — запуск

  • Сразу после установки нажать намекающее «Load model» в правой нижней части экрана;
  • Если пропустили этот момент — слева выбрать «Чат», и далее по центру сверху указать, какую модель запускать.

Скорость запуска модели напрямую зависит от скорости работы видеопамяти.

Failed to index the following model

Поскольку GPT-oss были выпущены совсем недавно, многие пользователи сталкиваются с ошибкой Failed to index the following model. Показываем, как быстро её исправить:

  • Слева выбрать раздел «Мои модели». В нужной модели под колонкой «Действия» нажать три точки и «Открыть в проводнике»;
  • В появившемся списке найти файл Model.yaml. Открыть с помощью обычного «Блокнота»;
  • В выделенном на изображении фрагменте замените «select» на «string»;
  • Сохранить изменения, закрыть.

Несколько примеров использования

С описанием нашей компании получилось не сильно хорошо

Со второй попытки тоже

Внятный анализ документа получился с третьего раза (документ — эта статья)

Генерация мини-статьи адекватная