LLM Arena: как люди помогают оценить ИИ?

Аватар автора
AI4Dev — AI for development /Artezio
Роман Куцев рассказывает о платформе LLM Arena, которую он основал. LLM Arena — это открытая краудсорсинговая платформа для оценки моделей на русском языке. Она позволяет любому пользователю тестировать и сравнивать LLM бесплатно. В видео узнаете: - Как работает бенчмарк LLM Arena? - Как формируется рейтинг на аренах? Насколько он справедлив? - Чем LLM Arena лучше для русскоговорящего пользователя, чем LMSYS Chatbot Arena? - Как не дать моделям обвести себя вокруг пальца? - Как подобрать лучшую модель для своих задач? Сейчас на платформе доступны 49 российских и зарубежных ИИ-моделей.

0/0


0/0

0/0

0/0