8 800 500-99-26 Для звонков по России

Что такое Qwen

Qwen — это открытая языковая модель от Alibaba, которую можно запускать локально, без облака и риска утечки данных. Она справляется с генерацией текстов, анализом, автоматизацией процессов и обучением на ваших данных — полностью автономно и безопасно.

Эффективная архитектура

Эффективная архитектура

Qwen 3 при обработке запроса использует лишь часть параметров — 3 из 30 млрд или 22 из 235 млрд, в зависимости от версии. Это снижает нагрузку на видеокарту и память, позволяя запускать систему даже на мощных рабочих станциях.
Локальный запуск

Локальный запуск

Модели Qwen 3 поддерживают до 128 000 токенов за один запрос: версия на 30B требует около 32 ГБ видеопамяти. Все данные обрабатываются внутри вашей системы, что обеспечивает конфиденциальность и безопасность.

Компактные рабочие станции

Производительные SFF‑системы с одной GPU для локального запуска QWEN. Подходят разработчикам, исследователям и стартапам, которым важны мощность, автономность и компактность.

Pro SFF Pro SFF Pro SFF Pro SFF Pro SFF Pro SFF

Pro SFF

Для ассистентов, автоматизации, генерации кода и FAQ-ботов. RTX 5090 с 32 ГБ VRAM обеспечивает запуск Qwen 3-30B-A3B с полным контекстом и высокой скоростью вывода токенов при отличном соотношении цена/производительность.

от 530 000 ₽
Узнать больше

Процессор

R9 9900X

Видеокарта

RTX 5090 32GB

Оперативная память

32GB RGB

NVME

2 TB NVMe 5.0

Операционная система

Linux Ubuntu
Ultra SFF Ultra SFF Ultra SFF Ultra SFF Ultra SFF Ultra SFF

Ultra SFF

Решение для исследований и работы с масштабными моделями Qwen вплоть до 72B параметров. Подходит для экспериментов с большими датасетами, тонкой настройки и стабильного инференса в задачах с высоким потреблением ресурсов. RTX 6000 Ada с 48 ГБ VRAM обеспечивает запас для длительных сессий и расширенного контекста.

от 1 100 000 ₽
Узнать больше

Процессор

R9 9950X

Видеокарта

RTX 6000 Ada 48GB

Оперативная память

64GB RGB

NVME

2 TB NVMe 5.0

Операционная система

Linux Ubuntu
ULTRA SFF ULTRA SFF ULTRA SFF ULTRA SFF ULTRA SFF ULTRA SFF

ULTRA SFF

Для масштабных моделей и сверхдлинных контекстов. RTX PRO 6000 с 96 ГБ VRAM позволяет запускать Qwen 3-235B-A22B и работать с объёмами до 256 000 токенов локально, без ограничений по памяти и производительности.

от 1 700 000 ₽
Узнать больше

Процессор

R9 9950X

Видеокарта

RTX PRO 6000 96GB

Оперативная память

192GB RGB

NVME

2 TB NVMe 5.0

Операционная система

Linux Ubuntu

Мощные рабочие станции

Мощные системы с двумя видеокартами для параллельных задач, работы с крупными моделями и ускоренного обучения. Подходят для исследовательских команд и проектов с высокой нагрузкой.

Entry Dual Entry Dual Entry Dual Entry Dual Entry Dual Entry Dual

Entry Dual

Для небольших команд на Qwen: две 7B-модели параллельно — инференс на одном GPU, LoRA/ batch-задачи на втором. Поддерживает квантованный 14B с урезанным контекстом.

от 820 000 ₽
Узнать больше

Процессор

Threadripper 7960X

Видеокарта

2x RTX 5080 16GB

Оперативная память

128GB ECC

NVME

2 TB NVMe 5.0

Операционная система

Linux Ubuntu
Pro Duo Pro Duo Pro Duo Pro Duo Pro Duo Pro Duo

Pro Duo

Подходит для работы с моделями Qwen до 72B в квантованном виде и с урезанным контекстом. Два RTX 5090 с 32 ГБ VRAM обеспечивают высокий пропускную способность и позволяют запускать крупные модели с шардированием между GPU.

от 1 250 000 ₽
Узнать больше

Процессор

Threadripper 7960X

Видеокарта

2x RTX 5090 32GB

Оперативная память

128GB ECC

NVME

2 TB NVMe 5.0

Операционная система

Linux Ubuntu
Ultra Duo Ultra Duo Ultra Duo Ultra Duo Ultra Duo Ultra Duo

Ultra Duo

Подходит для работы с моделями Qwen до 235B в квантованном виде и с длинным контекстом до 256 000 токенов. Две RTX 6000 Ada с 48 ГБ VRAM обеспечивают достаточный объём памяти для стабильного инференса и дообучения без жёстких ограничений по batch и контексту.

от 2 300 000 ₽
Узнать больше

Процессор

Threadripper 7960X

Видеокарта

2x RTX 6000 Ada 48GB

Оперативная память

128GB ECC

NVME

2 TB NVMe 5.0

Операционная система

Linux Ubuntu

Серверы RackStation

Серверные системы в форматах 4U и 5U для круглосуточной работы, разработки и масштабируемых ИИ-задач. Подходят для команд, которым важны надёжность, высокая производительность и возможность расширения до нескольких GPU.

Entry Rack Entry Rack Entry Rack Entry Rack Entry Rack

Entry Rack

Для малых ИТ-команд, которым нужен круглосуточный локальный сервис: чат-боты, генераторы контента. Компактно, надёжно, с уверенной производительностью.

от 1 250 000 ₽
Узнать больше

Процессор

Threadripper 7960X

Видеокарта

2x RTX 5090 32GB

Оперативная память

128GB ECC

NVME

2 TB NVMe 5.0

Операционная система

Linux Ubuntu
Pro Rack Pro Rack Pro Rack Pro Rack Pro Rack

Pro Rack

Для команд, работающих с fine-tuning и разработкой средних и крупных моделей. Увеличенный VRAM для более сложных задач.

от 2 300 000 ₽
Узнать больше

Процессор

Threadripper 7960X

Видеокарта

2x RTX 6000 Ada 48GB

Оперативная память

128GB ECC

NVME

2 TB NVMe 5.0

Операционная система

Linux Ubuntu
Scalable Rack Scalable Rack Scalable Rack Scalable Rack Scalable Rack

Scalable Rack

Для команд с перспективой масштабирования. Поддержка нескольких моделей, batch-инференс и обработка большого потока запросов.

от 4 400 000 ₽
Узнать больше

Процессор

Threadripper Pro 7975WX

Видеокарта

4x RTX 6000 Ada 48GB

Оперативная память

128GB ECC

NVME

2 TB NVMe 5.0

Операционная система

Linux Ubuntu

Серверы RackStation AI

Мощные серверы в формате Rack 6.5U для обучения, дообучения и продакшен-запуска больших языковых моделей. Подходят для ML-инженеров, R&D-отделов и корпоративных проектов с высокой нагрузкой.

Pro Rack AI Pro Rack AI Pro Rack AI Pro Rack AI Pro Rack AI

Pro Rack AI

Для ML-инженеров и исследовательских отделов. Высокая скорость дообучения и инференса — оптимально для прототипов и экспериментов.

Процессор

Threadripper Pro 7975WX

Видеокарта

4x RTX 5090 32GB

Оперативная память

768GB ECC

NVME

2 TB NVMe 5.0

Операционная система

Linux Ubuntu
Scalable Rack AI Scalable Rack AI Scalable Rack AI Scalable Rack AI Scalable Rack AI

Scalable Rack AI

Для стабильного продакшен-деплоя: высокая нагрузка, большое количество запросов, оркестрация нескольких моделей.

Процессор

Threadripper Pro 7975WX

Видеокарта

4x RTX 6000 Ada 48GB

Оперативная память

1152GB ECC

NVME

2 TB NVMe 5.0

Операционная система

Linux Ubuntu
Enterprise Rack Ai Enterprise Rack Ai Enterprise Rack Ai Enterprise Rack Ai Enterprise Rack Ai

Enterprise Rack Ai

Для enterprise-масштабов. Подходит для обслуживания большого числа одновременных запросов, работы с несколькими LLM и сложных AI-проектов. GPU на архитектуре NVIDIA Blackwell с 96 ГБ GDDR7 обеспечивает до 2,5× ускорения обучения и до 3× выше точность итераций моделей по сравнению с предыдущим поколением. Поддержка MIG позволяет разделять ресурсы на изолированные среды, а PCIe Gen 5 обеспечивает высокоскоростной обмен данными для ресурсоёмких задач.

Процессор

Threadripper Pro 7975WX

Видеокарта

6x RTX PRO 6000 96GB

Оперативная память

1152GB ECC

NVME

2 TB NVMe 5.0

Операционная система

Linux Ubuntu

Начните с тестирования

Тестирование и готовые конфигурации в наличии

Тестирование и готовые конфигурации в наличии

Вы можете протестировать системы перед покупкой и подобрать подходящую конфигурацию. Доступны варианты из наличия для быстрой отгрузки.

Почему важно запускать LLM локально

Защита данных

Данные остаются внутри инфраструктуры, что важно для финансового, юридического и медицинского сектора.

Минимальные задержки

Быстрый отклик и стабильная работа даже без доступа к интернету.

Экономия

После первоначальных затрат эксплуатация дешевле, чем при использовании облачных API.

Контроль и гибкость

Возможность дообучать модель, адаптировать под свои данные и процессы.

Тестирование QWEN

Модели Qwen3 протестированы на ключевых бенчмарках, отражающих их способности в многоязычных задачах, агентных сценариях, точном выполнении инструкций, программировании, логическом рассуждении и применении знаний.

Бенчмарк Qwen3-4B-Instruct-2507 Qwen3-30B-A3B-Instruct-2507 Qwen3-235B-A22B-Thinking-2507
MultiIF 69.6% 69.1% 84.4%
IFEval 63.5% 70.8% 80.6%
LiveCodeBench v6 83.4% 83.7% 87.8%
AIME25 35.1% 29.0% 74.1%
Arena-Hard v2 47.4% 21.6% 92.3%
Бенчмарк
Qwen3-4B-Instruct-2507
MultiIF 69.6% IFEval 63.5% LiveCodeBench v6 83.4% AIME25 35.1% Arena-Hard v2 47.4% 43.4%
Qwen3-30B-A3B-Instruct-2507
MultiIF 69.1% IFEval 70.8% LiveCodeBench v6 83.7% AIME25 29.0% Arena-Hard v2 21.6% 24.8%
Qwen3-235B-A22B-Thinking-2507
MultiIF 84.4% IFEval 80.6% LiveCodeBench v6 87.8% AIME25 74.1% Arena-Hard v2 92.3% 79.7%

Сценарии применения QWEN

Решения DigitalRazor с моделями QWEN подходят для задач, где важны автономность, безопасность и работа в локальной инфраструктуре. Мы подбираем готовые станции и серверы под реальные кейсы запуска LLM без облака и сторонних API.

  • Виртуальные корпоративные ассистенты

    Автоматизация взаимодействия с сотрудниками и клиентами: ответы на вопросы, помощь в работе с внутренними системами, проведение инструктажей — без передачи данных в облако.

    Виртуальные корпоративные ассистенты
  • Обработка и анализ документов

    Извлечение информации из договоров, заявок и отчётов, классификация документов, формирование сводок и автоматическая подготовка ответов.

    Обработка и анализ документов
  • Генерация аналитики и прогнозов

    Подготовка аналитических отчётов, моделирование бизнес-сценариев, прогнозирование спроса и оценка рисков на основе внутренних данных.

    Генерация аналитики и прогнозов
  • Рекомендательные системы

    Персонализированные подборки товаров, материалов или контента для клиентов и сотрудников, построенные на собственных корпоративных данных.

    Рекомендательные системы
  • Автоматизация рабочих процессов

    Создание скриптов и инструментов для автоматизации задач: проверка заявок, контроль качества, формирование стандартных документов и ответов.

    Автоматизация рабочих процессов

Решения для Qwen

Почему выбирают DigitalRazor

Мы создаём рабочие станции и серверы, оптимизированные под Qwen3 — с учётом архитектуры MoE, требований к памяти и вычислительным ресурсам. Это тщательно подобранные конфигурации, надёжная сборка и готовность к работе с самыми передовыми языковыми моделями.

Комплектация и настройка под ключ

Рабочие станции поставляются полностью готовыми к работе: установлены все драйверы, CUDA и оптимизированная среда для Qwen. Вам не придётся тратить время на настройку — просто включите систему и приступайте к проектам.

Максимальная производительность

Мы подбираем NVIDIA GPU с большим объёмом VRAM и оптимизируем систему под LLM-нагрузки. Это обеспечивает плавный отклик, стабильную работу и возможность обработки огромных контекстов.

Конфиденциальность данных

Все вычисления происходят локально — без облака и API. Полный контроль над данными и соответствие корпоративным стандартам безопасности.

Расширяемость под задачи

Системы легко масштабировать — добавляйте GPU или переходите на rack-формат по мере роста проектов. Инфраструктура растёт вместе с вашими идеями.

Сервис и поддержка на каждом шагу

Собственное производство, тестирование и сервисный центр: мы сопровождаем вашу систему от сборки до апгрейда и гарантии — всё под вашим контролем.

Наши клиенты

Мы убеждены, что компьютеры должны делать вашу работу более эффективной, и гордимся тем, что уже помогли тысячам компаний и частных лиц ускорить их деятельность.

Глобалтехэкспорт

Глобалтехэкспорт

МФТИ

МФТИ

Айтеко

Айтеко

Usetech

Usetech

МЭИ

МЭИ

Визионеро

Визионеро

ФИЦ Коми научный центр УрО РАН

ФИЦ Коми научный центр УрО РАН

Консультант+Аскон

Консультант+Аскон

Современные системы реновации

Современные системы реновации

Селигдар

Селигдар

ИПЭЭ РАН

ИПЭЭ РАН

Эффективные технологии

Эффективные технологии

XO Studios

XO Studios

Сбер

Сбер

Альфа-Банк

Альфа-Банк

Samsung

Samsung

Инновационный центр «Сколково»

Инновационный центр «Сколково»

Самарский университет

Самарский университет