Function calling без реальных данных / Ольга Цымбой и Рамиль Латыпов
Компьютерные науки
Обучение языковых моделей взаимодействовать с инструментами упирается в дефицит данных. Открытые датасеты ограничены по тематикам, содержат мало сложных сценариев и практически не встречаются на русском языке. На Saturday ML Party коллеги из Т-Банка Ольга Цымбой, старший исследователь-разработчик, и Рамиль Латыпов, исследователь-разработчик, рассказали, как они построили полностью синтетический пайплайн генерации function calling данных. А также разобрали шаги обучения и показали, как этот подход позволил прирастить качество на специализированных бенчмарках. #AIConference