Мультиагентные системы банковского сектора / Артём Хусаенов
Компьютерные науки
На Saturday ML Party Артём Хусаенов, CDS платформы цифровых ассистентов в Сбербанке, объяснил, как замерить качество агентов там, где автоматические оценки не дают прозрачного результата, LLM-as-a-judge не работает, а аутсорс-разметка по инструкциям не отображает реальности. А также рассказал, как перестроить продукт без потери пользовательского опыта. #AIConference