DRL Course | Value Function Approximation. Deep Q-Networks (DQN)

Аватар автора
OPEN DATA SCIENCE (ODS.AI)
В пятой лекции: Рассматриваются MDP с бесконечным пространством состояний; Обсуждаются аппроксимации Q-функции с помощью линейной комбинации и нейронных сетей; Выводится алгоритм Deep Q-Networks (DQN); Обсуждаются его различные модификации Наши соц.сети:

0/0


0/0

0/0

0/0