Дорн Ю.В. - Зимняя школа ИИ 2026 - 4. Многорукие бандиты и онлайн-оптимизация

Аватар автора
Teach-In
Многорукие бандиты и онлайн-оптимизация Дорн Юрий Владимирович 00:16 Что такое многорукие бандиты? 06:25 Пример: баннеры, кликабельность, эмпирическое среднее vs истинное матожидание 09:58 Adversarial (противоборствующие) бандиты 12:43 Алгоритм EXP3 30:05 Предсказание с помощью экспертов 33:24 FTRL и Online Mirror Descent: регуляризация как защита от переобучения/противника 44:18 Как importance weighting становится стохастической оценкой градиента для OCO-алгоритмов 46:53 UCB: неравенство Хёфдинга, доверительные интервалы 53:39 Thompson Sampling 57:16 Сведение бандитов к стохастической оптимизации 01:03:38 Функциональные и контекстуальные бандиты 01:09:31 Анонс семинара 01:10:58 Вопросы #data_science

0/0


0/0

0/0

0/0

0/0