Память и online-RL: опыт YandexGPT 5.1 / Алексей Колесов
Компьютерные науки
Алексей Колесов, CTO в Яндекс R&D, рассказал, как мы учили YandexGPT 5.1 лучше помнить факты и применять знания о них. А ещё показал, как у нас наконец стабильно заработал online-RL. #AITech