Пчелин К.К. - Машинное обучение с подкреплением - 10. Мультиагентные LLM-системы: паттерны, ловушки

Аватар автора
Мультиагентные LLM-системы: паттерны, ловушки, коллективное обучение Пчелин Константин Константинович 00:17 Введение 04:07 Мотивация и постановка 09:30 Паттерны разработки: команды из одиночных LLM 19:19 Формализм: Dec-POMDP и Markov Game 28:55 Ловушки независимого обучения 39:07 Коллективное обучение: VDN, QMIX, COMA 52:21 MAPPO и переход к LLM-командам 57:27 Открытые вопросы и итог

0/0


0/0

0/0

0/0

0/0