Qwen3-TTS - это как Elevenlabs только локально. Разбор и установка на ComfyUI

Аватар автора
AI Генератьон
Qwen3-TTS - это семейство продвинутых моделей синтеза речи (text-to-speech) от китайской компании Alibaba (Qwen), предназначенных для генерации естественного, многоязычного и потокового аудио в реальном времени. Поддерживает русский язык, управление тембром голосов с эмоциями, интонациями и клонированием по 3-секундному сэмплу и дизайном новых голосов через текстовые описания. Подходят для голосовых ассистентов, озвучки, переводчиков, игр, образования и чат-ботов, где речь звучит почти неотличимо от человеческой. ________________________________ ✨Таймкоды: 00:00 - Предисловие 01:11 - Что такое Qwen3 TTS 02:40 - Кому подойдут модели 03:10 - О чем это видео и какой у нас план 04:03 - Кастомные ноды, которые мы будем использовать для работы 04:27 - Поддержка канала 05:36 - Установка кастомных нод ComfyUI-QwenTTS 07:09 - Загрузка моделей 09:07 - Клонирование голоса 14:10 - Дефолтные голоса и управление эмоциями 17:48 - Дизайн голоса 18:49 - Вторая кастомная нода ComfyUI-Qwen-TTS и второй воркфлоу 24:11 - Разные папки для сохранения моделей 25:24 - Ошибка установки ноды из-за уровня безопасности комфи менеджера 26:42 - Выводы. Плюсы и минусы 30:22 - Как промтить инструкт для Qwen3 TTS и как не промтить 33:05 - Блок для постоянных зрителей 34:26 - Послесловие ________________________________ ✨Ссылки: Полезные видео по теме: ________________________________ Теги: Модель для генерации речи. Модель для генерации голоса. Бесплатный ИИ. Бесплатная модель для генерации голоса.

0/0


0/0

0/0

0/0