Обзор Reinforcement Learning с ICML | Дмитрий Бабаев, Яндекс

Аватар автора
Компьютерные науки
Это Дмитрий Бабаев, руководитель ML R&D в Яндекс Картах. Дмитрий рассказал о самых запоминающихся статьях про обучение с подкреплением с ICML этого года. Например, Дмитрий поговорил о работе Stop Regressing: Training Value Functions via Classification for Scalable Deep RL от DeepMind, которая посвящена нестандартному подходу к регрессиям.

Скачать Видео с Дзена / Dzen

Рекомендуем!

0/0


0/0

0/0

0/0