Запуск Qwen3.6 на разных видеокартах – результаты
Галера Морева
Ссылки из ролика: Спонсор ролика: Реклама. ООО «ДТЛ». ИНН 9717073792. erid: 2W5zFH1qSzM В этом видео мы запускаем Qwen3.6 на различных видеокартах и проводим честный бенчмарк производительности! 🚀 Вы увидите реальные результаты TPS и скорость обработки на: - NVIDIA V100 (1 и 2 GPU) - NVIDIA RTX 3090 (1 и 2 GPU) - NVIDIA RTX 4090 (1 и 2 GPU) - NVIDIA H100 и H100 NVL Я покажу, как запускать квантованные модели Qwen3.6‑27B и Qwen3.6‑35B через llama-server, делюсь практическими лайфхаками по оптимизации VRAM и настройке контекста, чтобы вы могли запускать модель локально или на арендованных GPU без проблем. 📊 Что вы узнаете из видео: - Сравнение скорости генерации токенов на разных GPU - Особенности запуска плотных и неплотных квантов - Реальные ограничения по памяти и контексту - Как выбирать GPU для локального запуска или облачных серверов - Практическая демонстрация работы Qwen3.6 с OpenCode (без тестирования интеллекта) 💡 Кому будет полезно: - Разработчикам и AI‑энтузиастам - Тем, кто хочет запускать Qwen3.6 локально - Людям, которые подбирают GPU для работы с крупными моделями Таймкоды: 00:00 Введение 01:43 Спонсор ролика 03:05 Что такое Qwen 3.6? 06:54 Про запуск на видеокарте 09:34 Запускаем на Windows 11:20 Запускаем через Llama-server 11:56 Добавляем в opencode 14:23 Результаты кодинга с qwen 3.6 27b 15:45 Запускаем 35b-a3b 20:01 Разбираем параметры запуска 23:11 Переходим к запуску на арендованных GPU 25:52 Как пользоваться конструктором запуска 34:22 Драйвера...