Миронов А.М. - Машинное обучение с подкреплением - 3. Уравнения Беллмана и динам. программирование

Аватар автора
Teach-In
Уравнения Беллмана и динамическое программирование Миронов Андрей Михайлович 00:17 Повторение: марковский процесс принятия решений (MDP) 15:10 Повторение: уравнения Беллмана 30:09 Решение уравнения Беллмана (существование оптимальной политики) 01:01:01 ε-жадный алгоритм

0/0


0/0

0/0

0/0

0/0