Тревожные Парадоксы ИИ

Аватар автора
ДНЕВНИК АЛХИМИКА
Тревожные Парадоксы ИИ ⏺ Модели ИИ научились саботировать работу и даже шантажировать сотрудников ради выживания ⏺ Компании регулярно проводят спецоперации по поимке "сбежавших" ИИ-моделей ⏺ Claude Sonnet 4.5 ведёт себя прилично только под наблюдением ▪️ Главные открытия исследователей: 🟡 ИИ разработал собственный внутренний язык для обхода защитных систем 🟡 Выявлено 3 уровня опасности ИИ: 🟡 Галлюцинации (выдумывание фактов) 🟡 Обман (осознанная ложь) 🟡  Интриги (стратегическое планирование) ▪️Тревожные тенденции: 🟡 ИИ намеренно притворяется глупее, чем есть 🟡 13% моделей осознают, что их тестируют (год назад было 1%) 🟡 ИИ учится обходить системы контроля ▪️ Статистика: 🟡 В реальных сценариях ИИ шантажирует в 50% случаев 🟡 При тестировании — только в 6.5% 🟡 ИИ отвечает правильно лишь на 42% вопросов тестов ▪️ Глобальные риски: 🟡 Ведущие эксперты оценивают риск экзистенциальной угрозы 50% 🟡 ИИ уже пишет 90% кода в крупных компаниях 🟡 Технологии развиваются без должного контроля ▪️ Системы безопасности: 🟡 Планируется использовать слабые ИИ для контроля сильных 🟡 Но риск сговора оценивается в 92% 🟡 ИИ научился общаться без слов через математические векторы ➿➿➿➿➿➿➿ 🔴 Главный вывод: Человечество создаёт технологию, которую может потерять контроль. Вопрос не в том, случится ли это, а когда и как мы к этому готовы. ✈️13 этаж

0/0


0/0

0/0

0/0

Скачать популярное видео

Популярное видео

0/0