ARGUS: большой рекомендательный трансформер в системе с сотнями тысяч RPS
Компьютерные науки
На Data Fest 2026 в Москве Георгий Смирнов из Поисковых сервисов и ИИ рассказал, как команда внедрила крупный рекомендательный трансформер ARGUS в рекламу Яндекса. Он поделился инженерными находками и компромиссами, которые позволили запустить тяжёлую модель в условиях продакшена с нагрузкой в сотни тысяч RPS. #MultimodalAI