RTX 4090 48GB за 330к: работа с локальной LLM

Аватар автора
Полезные ссылки: В предыдущем ролике я говорил: «Не берите RTX 4090, берите две RTX 3090». И вот я купил перепаянную RTX 4090 на 48 ГБ за 330 000 ₽. Сошёл с ума? Честно — нет. После 4 рабочих дней я понял, что это одна из самых оправданных покупок для локального AI-кодинга. В этом ролике — не бенчмарки, а реальный опыт. Я расскажу, как 90% задач стал решать на локальной Qwen 3.6 в 8-битном кванте с MTP, покажу свой vibe coding сетап (pi.dev, OpenCode, субагенты), и как я накодил полноценную систему бронирования с тестами — полностью локально. Сравню скорость чтения и генерации токенов на 4090 против двух 3090, объясню, почему всё же передумал насчёт «две 3090 лучше», и покажу главный минус 4090 — шум. Турбинный кулер на 100% звучит как мини-фабрика, и я расскажу, как с этим жить (или не жить). Также обсудим реальность локальных моделей: почему я предпочитаю локалку своему же облачному провайдеру, почему не влезает FP16 Qwen, и какие планы у меня на эту карту дальше — в том числе почему она скорее всего уедет в сервер, а мне вернутся 3090. Таймкоды: 00:00 Введение 01:10 Что я себе купил? И зачем? 03:28 Что я навайбкодил с этой картой 05:02 Задачи, где модели на этой карте не хватило 06:37 Чего я запускаю на этой карте 11:10 Неуспешный запуск 13:32 Запускаем pi.dev 16:48 Какие модели использую в работе 18:01 Шумность карты 21:18 Про виды охлаждение видеокарт 23:26 На этом тяжело остановиться 25:39 Немного саморекламы провайдера 26:01 Почему я занимаюсь локальными моделями?

0/0


0/0

0/0

0/0

0/0