Пчелин К.К. - Машинное обучение с подкреплением - 4. Метод Монте-Карло и TD метод. SARSA, Q-learning

Аватар автора
Метод Монте-Карло и TD метод. Алгоритмы SARSA и Q-learning Пчелин Константин Константинович 00:16 Вступление 03:21 Метод Монте-Карло 19:38 Temporal difference (TD) метод 34:31 Алгоритмы SARSA и Q-learning 53:41 TD(n) #Q_learning

0/0


0/0

0/0

0/0

0/0