8 800 500-99-26 Для звонков по России

Игровые ПК

Все модели

Модельный ряд
DigitalRazor

Уникальные

Уникальные компьютеры
с твоим дизайном

ПК в наличии

ПК готовые к отгрузке
в день заказа

Конфигуратор

Собрать
компьютер мечты

Подобрать игровой компьютер

По особенностям

По задачам

По видеокарте

По процессору

По цене

По играм

Рабочие станции

Персональные системы для 3D-графики, видеомонтажа и инжиниринга. Максимальная стабильность в профессиональном ПО.

GPU-серверы

Платформы для ИИ и HPC с поддержкой до 8 GPU. Создание отказоустойчивых кластеров для непрерывной обработки данных.

Подобрать рабочую станцию

По направлению

По задачам ИИ

По видеокарте

По процессору

По программам

GPU-серверы

Посмотреть все

RackStation Ai

Компактные решения для рендер-ферм, VFX и инференса

DevBox AI

Для локального обучения LLM, генеративных моделей и R&D

Scale

Для LLM > 70b, генеративных моделей и корпоративных задач.

HPC

Для построения AI кластеров, R&D центров и дата-центров

Ответьте на несколько вопросов о проекте — инженер подготовит детальный расчет

Подобрать GPU-сервер

По направлению

Серверы для ИИ

По задачам ИИ

По видеокарте

По конфигурации

Услуги

Посмотреть все

Апгрейд центр

Трейд-ин

Аксессуары

Клиентам

Подробные правила и условия обмена и возврата товаров

Частые вопросы

Быстрый способ найти ответ на интересующий вас вопрос

Компания

Почему выбирают компанию DigitalRazor

Уникальность, агрессивный дизайн, эффективность и мощная производительность.

Подробнее

Контакты Связаться с нами Отзывы Более 20 тыс. довольных клиентов Вакансии Стань частью нашей команды Проекты Истории реализованных проектов

Медиа

Новости События из мира игр, технологий и индустрии Статьи Полезные статьи о железе, играх и всём, что между

8 800 500-99-26 Ежедневно с 10:00 до 21:00

Главная
Медиа
Новости
Софт
Qwen3.5-Omni: 256 тысяч токенов контекста и генерация речи в реальном времени

Qwen3.5-Omni: 256 тысяч токенов контекста и генерация речи в реальном времени

Софт

31.03.2026

2 мин

Qwen3.5-Omni: 256 тысяч токенов контекста и генерация речи в реальном времени

DigitalRazor

Подписаться в Telegram

Содержание 4 раздела

Краткое содержание Расширенный контекст и архитектура Доминирование в тестах и умный стриминг Написание кода по видеозаписи

Получите готовый ПК под свои задачи

Подберём ПК под ваши задачи, соберём, протестируем и доставим готовым к работе.

Собрать свой ПК

или свяжитесь с нами

Подберём игровой ПК за 2 шага

Ответьте на несколько вопросов — покажем готовые сборки

Команда Alibaba Cloud представила Qwen3.5-Omni — новое поколение продвинутой мультимодальной модели. Она принимает на вход текст, изображения, аудио и видео, а затем генерирует текст и человеческую речь в режиме реального времени. Компания выпустила новинку сразу в трёх размерах — Plus, Flash и Light. Получить доступ к ним можно через Offline API и Realtime API.

Краткое содержание

Команда Alibaba Cloud представила мультимодальные модели Qwen3.5-Omni;
Контекстное окно новинки расширили с 32 до 256 тысяч токенов;
Нейросеть распознаёт 113 языков и превосходит конкурентов в тестах;
Алгоритмы научились самостоятельно писать код по видеозаписям экрана.

Расширенный контекст и архитектура

Главным отличием новинки от предшественника Qwen3-Omni стал серьёзно возросший масштаб. Контекстное окно расширили с 32 тысяч до 256 тысяч токенов. Теперь модель легко обрабатывает более 10 часов аудио или около 400 секунд видео в разрешении 720p за один запрос.

Распознавание речи охватывает 113 языков и диалектов, хотя ранее алгоритмы понимали всего 19. Синтез голоса также шагнул вперёд — нейросеть свободно говорит на 36 языках вместо прежних 10. Оба ключевых компонента системы под названиями Thinker и Talker перешли на архитектуру Hybrid-Attention MoE.

Алгоритмы прошли предварительное обучение на массиве из более чем 100 миллионов часов аудиовизуальных данных. Для тренировки и локального запуска столь масштабных проектов требуются серьёзные вычислительные мощности. Для этих целей отлично подойдут современные серверы для искусственного интеллекта с топовыми видеокартами на борту.

Доминирование в тестах и умный стриминг

Версия Plus продемонстрировала выдающиеся результаты на большинстве из 36 аудиовизуальных бенчмарков. В задачах общего понимания звука, перевода и ведения диалога она уверенно обошла модель Gemini 3.1 Pro. Генерация речи тоже оказалась на высоте. Модель Qwen3.5-Omni-Plus обогнала решения от ElevenLabs, GPT-Audio и Minimax по стабильности голоса.

Среди свежих возможностей появилась функция семантического прерывания. ИИ чётко отличает реальную реплику человека от случайного фонового шума. Также компания добавила клонирование голоса, гибкое управление эмоциями, встроенный WebSearch и инструмент FunctionCall. Технология ARIA динамически выравнивает текстовые и речевые токены. Это полностью устраняет пропуски слов при потоковом воспроизведении.

Написание кода по видеозаписи

Неожиданным побочным эффектом такого масштабного расширения стала совершенно новая способность. Представители Alibaba Cloud назвали эту фишку Audio-Visual Vibe Coding. Модель внимательно смотрит видеозапись экрана с аудиоинструкциями и затем пишет полностью рабочий программный код. Ей даже не нужен текстовый промпт для старта работы.

В компании подчёркивают, что никто не тренировал эту способность целенаправленно. Она возникла сама по себе как эмерджентное свойство в процессе обработки колоссальных объёмов информации.

Работать с подобными ИИ-инструментами и писать собственный код гораздо приятнее на качественном оборудовании. Мощные рабочие станции от DigitalRazor обеспечат безупречную плавность любых процессов и позволят забыть о системных зависаниях.

Не пропусти главное в мире ПК

Мы публикуем последние новости из компьютерного мира. Подписывайся, чтобы быть в курсе и ничего не пропустить.

Подписаться 130к

Получите готовый ПК под свои задачи

Подберём ПК под ваши задачи, соберём, протестируем и доставим готовым к работе.

Собрать свой ПК

или свяжитесь с нами

Софт Технологии ИИ

Автор Олег Олегович

С доставшимся от родителей воображением рассказываю о компьютерах и технологиях. Так что речь не о классике, если видишь слово «блок». В 14 лет починил видеокарту в духовке. Всё, что с вентилятором и радиатором — это ко мне.

Все статьи автора