Как оптимизировать ML‑модель

Аватар автора
MLinside
📌 Заполни анкету прямо сейчас и получи чек-лист «15 самых популярных вопросов с собеседований и ответы на них» Посмотрев это видео вы разберётесь, как ускорить ML-модель в продакшене и почему скорость инференса напрямую влияет на деньги, пользователей и инфраструктурные затраты бизнеса. Александр Дубейковский (ML-Engineer Авито, ex-Yandex, эксперт MLinside) на практических примерах показывает, почему модели «летают» в ноутбуке, но тормозят в реальных системах, и какие инженерные решения действительно дают прирост производительности. Квантование, прунинг, дистилляция, батчинг, кэширование, аппаратное ускорение и ONNX – вы поймёте, как и когда применять каждый подход, какие компромиссы между скоростью и точностью неизбежны и как не потерять качество на критичных кейсах. Видео будет особенно полезно тем, кто хочет перейти от академического ML к реальным бизнес-системам и научиться делать модели быстрыми, экономичными и ценными для продукта. Видео будет полезно: • ML-инженерам, работающим с продакшен-моделями • Data Scientist’ам, переходящим из исследований в продукт • Backend- и ML-platform инженерам • Тимлидам и техлидам ML-команд • Специалистам, готовящимся к росту от junior к middle или senior Спикер: Александр Дубейковский — ML-эксперт, экс-Яндекс, Авито, преподаватель и ментор MLinside. Наш курс «База ML» помогает войти в индустрию, получить реальный проект в портфолио и подготовиться к первому собеседованию. #ML2026 Если вам понравилось видео — поставьте лайк и...

Скачать Видео с Дзена / Dzen

Рекомендуем!

0/0


0/0

0/0

0/0