Grok 4.1: чемпион бенчмарков, но не собеседник мечты

Аватар автора
AI News | Новости ИИ и нейросетей
Grok 4.1 и версия Thinking стали громким обновлением от xAI Илона Маска, показав впечатляющие результаты в независимых рейтингах и тестах на эмоциональный интеллект. Модель уверенно лидирует в LMArena и демонстрирует рост в креативном письме и структурированных задачах. Однако за высокими цифрами скрывается неоднозначная реальность: в живом диалоге улучшения ощущаются слабее, а оптимизация под машинную оценку порой идет в ущерб естественности общения. Версия Thinking добавляет прозрачные рассуждения, но не решает ключевых проблем с галлюцинациями и подхалимством. Grok 4.1 — сильный инструмент для тестов и аналитики, но пока не универсальный AI-партнер для повседневного общения. #Grok #нейросети #LLM #искусственныйинтеллект #AItests #xAI #ThinkingMode #AIanalysis #чатботы #MachineLearning

0/0


0/0

0/0

0/0