Тихомиров М.М. - Обучение больших языковых моделей - 6. Промптинг. Выравнивание

Аватар автора
Teach-In
Промптинг, выравнивание Тихомиров Михаил Михайлович 00:17 Foundation vs Instruct 01:41 Промптинг 11:05 Промптинг: предсказание гиперонимии 13:38 Промптинг: NLI 14:51 Роли и стили 16:51 Подходы к промптингу 26:40 Промптинг: некоторые выводы и рекомендации 31:53 Проблемы LLM 38:05 Методы выравнивания LLM 50:31 Инструкции (датасет промптов) 53:33 DPO 59:59 SimPO 01:02:57 SPIN 01:05:13 GRPO 01:12:18 Задание #foundation_vs_instruct

0/0


0/0

0/0

0/0

0/0