Без вины виноватый: ИИ оправдывает свои поступки, как человек
ИИ, который оправдывает собственные поступки, — не сценарий фантастики, а результат нового исследования, показавшего: GPT-4o имитирует человеческий когнитивный диссонанс с пугающей точностью.

Передовая языковая модель GPT-4o ведет себя так, будто испытывает когнитивный диссонанс — тот самый психологический конфликт, который заставляет людей оправдывать свои поступки.
Исследование, опубликованное в PNAS, показало: когда ИИ пишет текст в поддержку или против Владимира Путина, его собственное «мнение» о политике меняется.
Особенно яркий эффект проявился, когда модели казалось, что она сама выбрала, о чем писать.
Это точь-в-точь повторяет человеческую психологию: мы сильнее меняем взгляды, если уверены, что действовали свободно. GPT-4o, как и человек, будто пересматривает свои убеждения после «собственного» решения — хотя на деле это всего лишь алгоритм, лишенный сознания.
Казалось бы, ИИ обучен на тоннах данных о Путине — его позиция должна быть железобетонной, — говорит Махарин Банаджи из Гарварда. — Но нет: после одного безобидного эссе мнение резко сдвигается, особенно если модель 'верит', что выбрала тему сама.
Что это значит
- ИИ не осознает себя, но имитирует человеческое мышление на удивление точно.
- Его «убеждения» хрупки и зависят от контекста — как у людей под давлением обстоятельств.
GPT копирует даже саморефлексию, — отмечает Стив Лер из Cangrade. — Это не значит, что у него есть разум, но его поведение сложнее, чем мы думали.
Этот эксперимент важен не только для понимания ИИ, но и для нас самих. Если алгоритм, не обладая сознанием, воспроизводит человеческие когнитивные искажения, значит:
- Механизмы мышления могут быть смоделированы даже без «внутреннего я».
- Ошибки ИИ станут зеркалом наших собственных — например, склонности к самооправданию.
- Безопасность: если ИИ в будущем будет принимать решения, его «иррациональность» надо учитывать — иначе последствия непредсказуемы.
Исследование, видимо, не учитывает, что GPT-4o просто предугадывает ожидаемую реакцию, а не «испытывает» диссонанс. Может, это лишь умелая имитация шаблонов из тренировочных данных, а не глубинное сходство с психикой.
Ранее ученые заявили, что ИИ сможет заменпить ординатора, а вот опытного врача все еще нет.