Новый алгоритм анализирует эмоции по голосу в реальном времени

Максим Наговицын11.06.2025317

Сбербанк и ВШЭ представили систему, которая анализирует не только лицо, но и то, что за ним скрыто.

Новый алгоритм анализирует эмоции по голосу в реальном времени
Источник: нейросеть

Ученые из Центра практического Искусственного Интеллекта Сбербанка и Высшей школы экономики создали систему, которая распознает эмоции не только по лицу, но и по голосу. Раньше алгоритмы анализировали мимику отдельно, теперь же модель учитывает и речь, и интонацию, и даже то, как эмоции меняются со временем.

Новая технология объединяет два подхода: временные сверточные сети (TCN) и трансформеры. Это позволяет точнее улавливать динамику — например, когда человек сначала злится, а потом резко успокаивается.

Точность выросла на 10% по сравнению с системами, которые работают только с изображением.

Исследование опубликовано в сборнике конференции AIST.

Где это пригодится:

  • В кол-центрах — чтобы сразу понимать, доволен клиент или раздражен.
  • В маркетинге — для анализа реакции на рекламу.
  • В безопасности — чтобы замечать агрессию или панику в толпе.

Андрей Савченко, научный директор Центра:

Мы научили систему работать в реальных условиях — при плохом освещении, шуме, даже если лицо частично скрыто. Это практическая модель, которую можно внедрять уже сейчас. Например, в телемедицине или виртуальных ассистентах.

Сейчас разработчики улучшают алгоритм, чтобы он адаптировался к еще более сложным сценариям.

Главное преимущество — мультимодальность. Человек редко выражает эмоции только лицом или только голосом. Обычно все работает вместе: жест, интонация, пауза в речи. Чем ближе алгоритм к такому анализу, тем меньше ошибок.

Это особенно важно там, где эмоции влияют на решения:

  • В переговорах — если система поймет, что клиент колеблется, менеджер сможет склонить его к сделке.
  • В образовании — платформа подстроится под настроение ученика, снизив или увеличив нагрузку.
  • В психиатрии — поможет отслеживать состояние пациентов дистанционно.

Технология снижает зависимость от идеальных условий. Камеры и микрофоны есть везде, но они часто дают шумные данные. Если система работает с этим — она дешевле в масштабировании.

Однако сохраняется этическая проблема. Чем точнее ИИ распознает эмоции, тем проще манипулировать людьми. Например, кол-центр может использовать данные, чтобы давить на слабые места клиента. Или работодатель — анализировать вовлеченность сотрудников без их согласия.

Ранее ученые заметили, что женщины лучше мужчин разбираются в эмоциях.

Подписаться: Телеграм | Дзен | Вконтакте


Net&IT

Нейросети обходят полиграф в точности выявления лжи
Нейросети обходят полиграф в точности выявления лжи

Что, если машина распознает обман лучше в

Ученые разработали новую систему рекомендаций контента
Ученые разработали новую систему рекомендаций контента

Представьте, что Netflix перестал навязыв...

Игра в бога: кто и зачем создает виртуальных близнецов людей
Игра в бога: кто и зачем создает виртуальных близнецов людей

Представьте, что ваше тело можно протести...

ИИ-врачам рано доверять не только жизнь, но и первичные рекомендации
ИИ-врачам рано доверять не только жизнь, но и первичные рекомендации

Искусственный интеллект советует женщинам лечи...

Почему нейросети до сих пор не понимают, что творят
Почему нейросети до сих пор не понимают, что творят

Триллионы параметров, миллиарды вычислений&nbs...

Российские ИИ и 3D-принтеры победили на конкурсе БРИКС
Российские ИИ и 3D-принтеры победили на конкурсе БРИКС

Российские стартапы доказали, что могут к...

Ученые СПбГУ упростили расчеты для стабильной связи
Ученые СПбГУ упростили расчеты для стабильной связи

Представьте, что ваш телефон внезапн...

Невидимый хвост: почему чистка куки не спасает от слежки
Невидимый хвост: почему чистка куки не спасает от слежки

Вы чистите куки и думаете, что тепер...

Ученые изобрели способ записывать информацию во льду
Ученые изобрели способ записывать информацию во льду

Вместо облачных технологий — ледяны...

Чем рискуют ученые, доверяя ИИ свои статьи
Чем рискуют ученые, доверяя ИИ свои статьи

Ошибка алгоритма может стоить исследователю ре...

От 5G до квантов: как сети учатся выживать в мире перегрузок
От 5G до квантов: как сети учатся выживать в мире перегрузок

Иногда один оборванный кабель оставляет целую ...

Ученые нашли способ уменьшить нейросети без потери качества
Ученые нашли способ уменьшить нейросети без потери качества

Глубокое обучение напоминает бардак в шка...

Новый чип ускоряет обработку сигналов в 100 раз
Новый чип ускоряет обработку сигналов в 100 раз

Обычный ИИ тратит на анализ сигналов...

Ученые создали идеальный генератор чисел
Ученые создали идеальный генератор чисел

Что, если случайность — не&nbs

Надежно как в ДНК: когда данные начнут жить тысячелетиями
Надежно как в ДНК: когда данные начнут жить тысячелетиями

Жесткие диски выходят из строя а мол...

Поиск на сайте

ТОП - Новости мира, инновации

Новости компаний, релизы

Больше никаких цифр: теперь квитанции в приложении Альфа-Банка вбиваются сами
Автономные дроны без веб-интерфейса: просто API и никаких сложностей
ITPOD обновил номенклатуру серверов — разбираем обозначения
Стажировка на Казанском вертолетном заводе – как студенты осваивали авиастроение
Лаборатория по поиску киберугроз в МИФИ: студенты и эксперты BI.ZONE объединяются