CosyVoice3 отличная TTS для озвучки текста

Аватар автора
Cosy Voice 3 - это TTS модель (text to speech): ✔️ Хорошо работает с русским текстом, ошибок очень мало. ✔️ Хорошо клонирует голоса по 5-10 секундному голосовому отрывку. ✔️ Мало потребляет видео памяти от 6-8Гб VRAM. ✔️ Может работать в режиме диалогов, поддерживает до 4 спикеров и может сохранять, каждого спикера на отдельную дорожку. ✔️ Можно сохранять голоса в модели, чтобы потом не искать аудиофайл и не подбирать подрезку отрывка. ✔️ Есть поддержка некоторых тегов: вздох, грусть, радость, громче, тише, но в наборе узлов не реализовано. МЕНЮ 00:41 - Установка Cosy Voice 01:18 - Разбор узлов и основных моментов работы с CosyVoice3 06:13 - Узел Cross Lingual 08:48 - Узел Voice Conversion 12:35 - Узел для работы с диалогами 17:05 - Как сохранить голоса в модель 🔑 Все ссылки и файлы доступны на Boosty:

0/0


0/0

0/0

0/0

0/0