LTX 2 - видео audio - low-vram

Аватар автора
StableDif | ComfyUI | Automatic1111
Ключи для LOW-VRAM --preview-method none (отключает preview в ksamplers чтобы уменьшит vram) --reserve-vram 4 (зарезервировать 4Гб vram под систему) --use-pytorch-cross-attention (принудительно включает sdpa внимание) --lowvram (для снижения требований к vram) --cache-none (отключается кэш результатов узлов) LTX-2 — это многофункциональная модель для генерации видео со речью, звуковыми эффектами и музыкой. Модель может также использоваться как апскейлер. Разрешение от 1280х720 до 1920х1088. Качество озвучки высокое и поддерживает мультиязычность, в том числе русский язык. Можно озвучивать несколько персонажей в одном видео. Можно делать описания голоса, например говорит быстро или медленно, грубый или нежный голос, высокий или низкий. FPS =24-25 кадров в секунду. Скорость генерации на RTX 5090 около 100 сек, при следующих настройках 121 кадр, 720p. Эта модель очень быстрая при таких возможностях и качестве. Потребление видеопамяти при выше сказанных настройках около 23Гб для Fp8 и 17Гб для Fp4, но пользователи пишут, что умудрялись запускать генерацию даже на 8Гб VRAM. Checkpoint модель доступна в форматах Fp16, Fp8, Fp4. Разница между Fp16 и Fp8 минимальна, а вот Fp4 заметно слабее в деталях. Fp8 предпочтительнее. МЕНЮ 02:50 - Схемы на LTX2 04:38 - Полезные ресурсы по LTX 2 05:39 - Ресурс для написания prompt для LTX 2 06:57 - Схема T2V 07:18 - Куда поместить модели 15:36 - I2V Workflow 19:28 - Video Detailer 21:22 - Выводы 🔑 Все ссылки и файлы доступны на Boosty:

0/0


0/0

0/0

0/0