Ученые разработали новую систему рекомендаций контента

Максим Наговицын16.07.2025647

Представьте, что Netflix перестал навязывать одни и те же жанры и стал немного менее предсказуемым в рекомендациях — так работает новый алгоритм T-Bank AI Research.

Ученые разработали новую систему рекомендаций контента
Источник: нейросеть

Ученые из T-Bank AI Research разработали новый метод рекомендаций — Sampled Maximal Marginal Relevance (SMMR). Он работает на 10% быстрее аналогов и делает подборки разнообразнее. Теперь алгоритм не зацикливается на одном жанре, а предлагает неожиданные, но подходящие варианты.

Раньше системы выдавали однотипный контент: если вы смотрели комедии, вам показывали только их. Новости, товары, фильмы — всё упиралось в «информационный пузырь».

Информационный пузырь — ситуация, когда алгоритмы показывают только контент, похожий на прошлые выборы пользователя, из-за чего его кругозор искусственно сужается.

SMMR ломает этот шаблон: он не просто выбирает самое релевантное, а случайно берет из топ-кандидатов. Так в ленте появляются книги не только из любимого жанра, но и, например, научпоп или триллеры, которые могли бы зацепить.

Как это работает

  • Вместо одного идеального варианта алгоритм берет несколько из короткого списка.
  • С каждым шагом выборка расширяется, а количество итераций сокращается.
  • Можно регулировать «температуру» — баланс между точностью и разнообразием.

На тестах с фильмами (MovieLens), покупками (Dunnhumby) и новостями (MIND) метод показал стабильный результат. Он в 2–10 раз быстрее классических MMR и DPP и добавляет 5–10% разнообразия.

T-Bank уже внедряет SMMR в Т-Шопинг и соцсеть Пульс. Для бизнеса это рост вовлеченности, для пользователей — больше открытий без потери персонализации.

Код выложен в открытый доступ на Github.

Метод SMMR решает две ключевые проблемы рекомендательных систем: скорость и разнообразие. Для бизнеса это значит снижение затрат на вычисления и рост продаж за счет более широкого охвата каталога. Для пользователей — меньше предсказуемости и больше шансов найти что-то по-настоящему новое. Особенно ценно, что алгоритм не требует полного пересмотра архитектуры — его можно встроить в текущие системы.

Правда, пока не ясно, как метод поведет себя в условиях сильного дисбаланса данных. Например, если у пользователя 90% просмотров — комедии, а остальные 10% — разрозненные жанры, не приведет ли случайный выбор к резкому падению релевантности? Авторы тестировали SMMR на открытых датасетах, но в реальных сервисах с динамичными предпочтениями возможны нюансы.

Ранее ученые выяснили, что звездные рейтинги продают товары лучше цифровых.

Подписаться: Телеграм | Дзен | Вконтакте


Net&IT

Поиск на сайте

Лента новостей

Пресс-релизы