ИИ Amazon хуже работает с диалектами

Максим Наговицын16.08.2025771

ИИ-помощники могут быть незаменимыми, но только если вы говорите на правильном языке.

ИИ Amazon хуже работает с диалектами
Источник: нейросеть

Исследователи из Корнеллского университета выяснили, что Amazon Rufus — виртуальный помощник для покупок — хуже понимает вопросы, написанные на диалектах английского, особенно если в них есть опечатки. Например, на афроамериканском варианте английского (AAE) он чаще дает расплывчатые или неверные ответы.

Ученые разработали систему оценки чат-ботов, чтобы проверить, насколько они предвзяты к пользователям, которые пишут не на «стандартном» американском английском. Это важно, ведь все больше сервисов внедряют ИИ-помощников, обученных в основном на „правильном“ языке.

Сейчас боты работают хуже для тех, кто использует диалекты, но это можно исправить, — говорит Эмма Харви, автор исследования. — Если научить модели понимать разные варианты речи, ответы станут точнее.

Чат-боты сейчас помогают в серьезных делах: от образования до госуслуг, — добавляет соавтор Эллисон Кенике. — Мы проверили, как они справляются с диалектами и неформальными запросами.

Для теста ученые взяли Amazon Rufus и с помощью инструмента MultiVALUE перевели стандартные фразы на пять диалектов:

  • афроамериканский английский,
  • чикано (латиноамериканский вариант),
  • аппалачский (региональный диалект США),
  • индийский английский,
  • сингапурский английский.

Диалект — это разновидность языка, которая отличается от стандартного произношением, грамматикой или словами. Например, афроамериканский английский (AAE) использует фразы вроде «She be working» вместо „She is working“ — для носителя это естественно, но ИИ может не распознать смысл.

Затем добавили опечатки, убрали пунктуацию и изменили регистр букв — как в реальной переписке.

Оказалось, Rufus чаще ошибается в ответах на диалектах, а с опечатками ситуация ухудшается.

Проблема в грамматических особенностях, — поясняет Кенике. — Если бот обучен на «книжном» языке, он плохо понимает миллионы людей.

Исследование полезно не только для Amazon, но и для всех, кто разрабатывает ИИ-помощников.

Оно показывает: если обучать модели на разнообразных данных, включая диалекты и «неидеальные» запросы, сервисы станут доступнее.

Например, голосовые ассистенты смогут лучше понимать акценты, а чат-боты — отвечать даже на сленге.

Это особенно важно для сфер вроде медицины или банкинга, где ошибка бота может стоить денег или здоровья.

Исследование проверяло только один бот (Rufus) и ограниченный набор диалектов. Неясно, насколько результаты применимы к другим ИИ — например, ChatGPT или голосовым ассистентам. Кроме того, тестировали искусственно созданные запросы, а не реальные вопросы пользователей.

Ранее ученые выяснили, почему ИИ не чувствует как человек.

Подписаться: Телеграм | Дзен | Вконтакте


Net&IT

Поиск на сайте

Лента новостей

Пресс-релизы