Москва, Россия — 14 июля 2025 г.
Ученые из
Разработка команды российских ученых из
Результаты исследования были признаны мировым научным сообществом и представлены на одной из ведущих конференций в области
машинного обучения и ИИ по информационному поиску уровня, А* —
Суть открытия
Традиционные алгоритмы стремятся подбирать максимально подходящие объекты — товары, фильмы, новости — основываясь на предпочтениях пользователя. Однако такой подход нередко приводит к однотипным рекомендациям, формируя так называемый «информационный пузырь», когда пользователь видит только те товары или контент, которые схожи с его предыдущими интересами. Например, если пользователь часто смотрит комедии, модели персонализации будут показывать только этот жанр, не предлагая альтернатив. Аналогичная проблема наблюдается и в новостных лентах: алгоритм фиксирует клики на самые заметные заголовки и начинает продвигать похожий контент, даже если сам материал не интересен пользователю или его потребности в информации намного шире.
Метод SMMR решает эту проблему за счет вероятностного выбора: вместо того чтобы каждый раз отдавать предпочтение одному наиболее релевантному объекту, алгоритм случайным образом выбирает из ограниченного круга подходящих вариантов. Такой подход обеспечивает большее разнообразие контента и помогает пользователю открывать новое знание.
Помимо повышения разнообразия, SMMR также работает быстрее, чем его известные аналогии — MMR (Maximal Marginal Relevance) и DPP (Determinantal Point Process). Алгоритм выбирает несколько объектов за одну итерацию и увеличивает объем выборки с каждым шагом, что снизило количество необходимых шагов с 100 до 5–10 на размере выборки из 3000 кандидатов. В результате новая методика оказалась в 2–10 раз быстрее MMR и DPP и при этом обеспечила рост разнообразия рекомендаций на 5–10%.
Метод SMMR выбирает случайным образом похожие категории для показа, что повышает скорость и разнообразие рекомендаций.
Уникальность метода
Метод SMMR представляет собой развитие классических подходов к формированию разнообразных рекомендаций и отличается рядом принципиальных особенностей:
Рекомендательные системы сегодня выполняют гораздо более сложную задачу, чем просто угадывать интересы пользователя. Их цель — предлагать
контент, который человек мог бы не обнаружить самостоятельно. Например, при поиске книг в
Применение метода SMMR может принести практическую пользу как бизнесу, так и пользователям. Для цифровых платформ это означает рост удовлетворенности аудитории: рекомендации становятся не только релевантными, но и разнообразными, что помогает удерживать внимание и повышать вовлеченность. Например, стриминговый сервис вместо десяти однотипных фильмов теперь может предложить пять предсказуемых и пять неожиданных, но потенциально интересных вариантов. Это также способствует более равномерному охвату каталога — больше единиц контента получают шанс быть показанными, что выгодно для продавцов, производителей и агрегаторов. Для пользователей это открывает новые возможности: вместо зацикленности на одном жанре или товарной категории они получают разнообразные предложения, что делает взаимодействие с сервисом более осмысленным и персонализированным.
Метод SMMR успешно протестирован на трех открытых датасетах: MovieLens (фильмы), Dunnhumby (покупки) и MIND (новости). Он демонстрирует стабильные результаты как в потребительских сценариях (подбор фильмов, товаров), так и в более динамичных — например, в рекомендациях новостей.
Метод размещен в открытой библиотеке
Похожие новости