Дмитрий Аникин. Data Science в Касперском / Хороший Python код / MLOps
Анастасия Никулина
В интервью Дмитрий Аникин делится опытом построения инфраструктуры ML-моделей в Касперском, расскажет о том, почему у Data Scientist возникают проблемы с качественным кодом, заодно поговорили и о таком понятии как "хороший код". Весь опыт он отразил в своем докладе "О хороших практиках построения инфраструктуры ML-моделей", с которым будет выступать на конференции Python разработчиков Moscow Python Conf++ 2021. Конференция будет проходить с 27-28 сентября 2021. Таймкоды: 00:00 Розыгрыш билета на конференцию 00:30 Почему UncleDijkstra? 02:00 Что делают Data Scientist в Касперском? 03:50 Как обходить распознавание лиц 06:50 Приходит ли бизнес сам с задачами по ML? 09:00 Почему 80% ML моделей не доходят до продакшн? 11:17 Соотношение проектов исследовательских моделей и моделей для продакшн 13:00 Одна из причин не выпуска в прод: сами заказчики часто переобуваются 14:30 Советы для решения проблем с продакшн 17:28 Data Scientistы не умеют писать код 21:13 MLOps, курсы Andrew Ng 21:58 Что такое «хороший код»? 22:25 Хороший код легко поддерживать 22:55 Хороший код - код, который приятно читать 23:32 Хороший код соответствует код-стайлу 25:54 Воспроизводимость 26:04 Jupyter Notebook чем он хорош и плох одновременно 27:55 Хороший код, зачем необходимо код разбивать на функции 28:57 Moscow Python Conf++ 30:08 MLOps продолжающийся тренд? 32:05 Тренд в сторону Full stack Data Scientist 32:25 JFrog, MLFlow, DVC 34:40 Обновление DVC 37:03 О проекте, сколько он длился, камни...