Введение в обучение с подкреплением в MATLAB (reinforcement learning)
ЦИТМ Экспонента
Файлы вебинара лежат здесь (требуется регистрация) 00:00 Введение 00:37 Что такое «Обучение с подкреплением» 11:34 Обучение с подкреплением»: базовые идеи и терминология 22:35 Q Learning 31:12 Deep Q Learning 39:00 Рабочий процесс 44:51 Заключение Обучение с подкреплением - технология, которая становится все более популярной в последнее время. Это связано с переходом алгоритмов обучения с подкреплением на нейросетевые подходы. В вебинаре "Введение в обучение с подкреплением с MATLAB" мы рассмотрели базовые принципы этого перехода. Обучение с подкреплением — область исследований, которая была создана для решения задач оптимального управления, в связи с развитием и применением методов глубокого обучения приобретающая все большую популярность в последнее время. Применение подхода глубокого обучения к этой области исследований позволяет решать задачи, которые раньше считались неразрешимыми. Алгоритмы из этой области применяются во многих отраслях науки и техники, где используются сложные системы принятия решений и классические алгоритмы не находят оптимальных решений или находят их за неприемлемо большой промежуток времени, таких как: Робототехника; Беспилотные автомобили; Оптимальное управление; Маркетинг; Финансы (трейдинг). Данный вебинар посвящён введению в тему обучения с подкреплением. Мы рассмотрим общий подход в этой области исследований, а для того, чтобы материал был доступен и понятен — продемонстрируем несколько примеров применения алгоритмов обучения с...