Рекомендательная система - Recommender system

Система рекомендаций или система рекомендаций (иногда заменяющая «систему» ​​синонимом, таким как платформа или движок), является подклассом системы фильтрации информации, которая стремится предсказать «рейтинг» или «предпочтение», которое пользователь отдает элементу. .

Рекомендательные системы используются во множестве областей, среди которых общепризнанными примерами являются генераторы списков воспроизведения для видео- и музыкальных сервисов, рекомендатели продуктов для интернет-магазинов или рекомендатели контента для платформ социальных сетей и рекомендатели открытого веб-контента. Эти системы могут работать с использованием одного входа, например музыки, или нескольких входов внутри и между платформами, такими как новости, книги и поисковые запросы. Существуют также популярные рекомендательные системы для определенных тем, таких как рестораны и онлайн-знакомства . Также были разработаны рекомендательные системы для изучения исследовательских статей и экспертов, сотрудников и финансовых служб.

Обзор

В рекомендательных системах обычно используется либо совместная фильтрация, либо фильтрация на основе содержимого (также известная как индивидуальный подход), а также другие системы, такие как системы, основанные на знаниях . Подходы к совместной фильтрации строят модель на основе прошлого поведения пользователя (ранее приобретенные или выбранные предметы и / или числовые рейтинги, присвоенные этим элементам), а также аналогичные решения, принятые другими пользователями. Затем эта модель используется для прогнозирования элементов (или рейтингов для элементов), которые могут быть интересны пользователю. Подходы к фильтрации на основе содержимого используют серию дискретных, предварительно помеченных характеристик элемента, чтобы рекомендовать дополнительные элементы с аналогичными свойствами. . Современные рекомендательные системы обычно объединяют один или несколько подходов в гибридную систему.

Различия между совместной и контентной фильтрацией можно продемонстрировать, сравнив две ранние рекомендательные системы музыки - Last.fm и Pandora Radio .

  • Last.fm создает «станцию» рекомендуемых песен, наблюдая, какие группы и отдельные треки регулярно слушает пользователь, и сравнивая их с поведением слушателей другими пользователями. Last.fm будет воспроизводить треки, которых нет в библиотеке пользователя, но которые часто воспроизводятся другими пользователями со схожими интересами. Поскольку этот подход использует поведение пользователей, он является примером метода совместной фильтрации.
  • Pandora использует свойства песни или исполнителя (подмножество 400 атрибутов, предоставленных проектом Music Genome Project ) для создания «станции», которая воспроизводит музыку с аналогичными свойствами. Обратная связь с пользователем используется для уточнения результатов радиостанции, при этом не выделяются определенные атрибуты, когда пользователю «не нравится» определенная песня, и подчеркиваются другие атрибуты, когда песня «нравится» пользователю. Это пример контент-ориентированного подхода.

У каждого типа системы есть свои сильные и слабые стороны. В приведенном выше примере Last.fm требует большого количества информации о пользователе, чтобы давать точные рекомендации. Это пример проблемы холодного запуска , распространенной в системах совместной фильтрации. В то время как Pandora требует очень мало информации для запуска, она гораздо более ограничена по объему (например, она может давать только рекомендации, аналогичные исходному сиду).

Рекомендательные системы - полезная альтернатива алгоритмам поиска, поскольку они помогают пользователям находить элементы, которые иначе они могли бы не найти. Следует отметить, что рекомендательные системы часто реализуются с использованием поисковых систем, индексирующих нетрадиционные данные.

Рекомендательные системы были впервые упомянуты в техническом отчете как «цифровая книжная полка» в 1990 году Юсси Карлгреном из Колумбийского университета, а с 1994 года реализованы в широком масштабе и проработаны в технических отчетах и ​​публикациях Юсси Карлгреном, затем в SICS, и исследовательскими группами. во главе с Патти Мэйс из Массачусетского технологического института, Уиллом Хиллом из Bellcore и Полом Резником из Массачусетского технологического института, чья работа с GroupLens была удостоена награды ACM Software Systems Award 2010 года .

Монтанер представил первый обзор рекомендательных систем с точки зрения интеллектуального агента. Адомавичус представил новый альтернативный обзор рекомендательных систем. Herlocker предоставляет дополнительный обзор методов оценки рекомендательных систем, а Beel et al. обсудили проблемы офлайн-оценок. Beel et al. также предоставили обзоры литературы по имеющимся системам рекомендаций по исследовательским работам и существующим проблемам.

На рекомендательные системы было выдано несколько патентов.

Подходы

Совместная фильтрация

Пример совместной фильтрации на основе рейтинговой системы

Одним из широко используемых подходов к разработке рекомендательных систем является совместная фильтрация . Совместная фильтрация основана на предположении, что люди, которые соглашались в прошлом, согласятся в будущем, и что им понравятся предметы того же типа, что и в прошлом. Система генерирует рекомендации, используя только информацию о профилях рейтинга для разных пользователей или товаров. Обнаруживая одноранговых пользователей / элементы с историей рейтингов, аналогичной текущему пользователю или элементу, они генерируют рекомендации, используя это окружение. Методы совместной фильтрации подразделяются на основанные на памяти и основанные на модели. Хорошо известным примером подходов, основанных на памяти, является алгоритм, основанный на пользователях, а подходов, основанных на моделях, - это Рекомендации по отображению ядра .

Ключевым преимуществом подхода совместной фильтрации является то, что он не полагается на контент, анализируемый машиной, и, следовательно, он способен точно рекомендовать сложные элементы, такие как фильмы, не требуя «понимания» самого элемента. Многие алгоритмы использовались для измерения сходства пользователей или элементов в рекомендательных системах. Например, подход k-ближайшего соседа (k-NN) и корреляция Пирсона, впервые реализованные Алленом.

При построении модели на основе поведения пользователя часто делается различие между явными и неявными формами сбора данных .

Примеры явного сбора данных включают следующее:

  • Просить пользователя оценить элемент по скользящей шкале.
  • Просить пользователя о поиске.
  • Просить пользователя оценить коллекцию элементов от избранных до наименее любимых.
  • Представляем пользователю два предмета и просим его выбрать лучший из них.
  • Просить пользователя создать список предметов, которые ему нравятся (см. Классификацию Роккио или другие подобные методы).

Примеры неявного сбора данных включают следующее:

  • Наблюдение за товарами, которые пользователь просматривает в интернет-магазине.
  • Анализ времени просмотра элемента / пользователя.
  • Ведение учета товаров, которые пользователь покупает в Интернете.
  • Получение списка элементов, которые пользователь слушал или смотрел на своем компьютере.
  • Анализируя социальную сеть пользователя и обнаруживая похожие симпатии и антипатии.

Подходы к совместной фильтрации часто страдают от трех проблем: холодного запуска , масштабируемости и разреженности.

  • Холодный старт : для нового пользователя или элемента недостаточно данных, чтобы давать точные рекомендации. Примечание: одним из наиболее часто используемых решений этой проблемы является алгоритм «Многорукий бандит» .
  • Масштабируемость : во многих средах, в которых эти системы дают рекомендации, есть миллионы пользователей и продуктов. Таким образом, для расчета рекомендаций часто требуется большая вычислительная мощность.
  • Редкость : количество товаров, продаваемых на крупных сайтах электронной коммерции, чрезвычайно велико. Самые активные пользователи оценили только небольшую часть всей базы данных. Таким образом, даже самые популярные товары имеют очень мало оценок.

Один из самых известных примеров совместной фильтрации - это совместная фильтрация по элементам (люди, которые покупают x, также покупают y), алгоритм, популяризированный системой рекомендаций Amazon.com .

Многие социальные сети изначально использовали совместную фильтрацию, чтобы рекомендовать новых друзей, группы и другие социальные связи, исследуя сеть связей между пользователем и их друзьями. Совместная фильтрация по-прежнему используется как часть гибридных систем.

Контентная фильтрация

Другой распространенный подход при разработке рекомендательных систем - фильтрация на основе содержимого . Методы фильтрации на основе содержимого основаны на описании элемента и профиле предпочтений пользователя. Эти методы лучше всего подходят для ситуаций, когда есть известные данные об элементе (имя, местоположение, описание и т. Д.), Но не о пользователе. Основанные на содержании рекомендатели рассматривают рекомендацию как проблему классификации, специфичную для пользователя, и изучают классификатор для симпатий и антипатий пользователя на основе характеристик элемента.

В этой системе ключевые слова используются для описания элементов, и создается профиль пользователя, чтобы указать тип элемента, который ему нравится. Другими словами, эти алгоритмы пытаются рекомендовать элементы, похожие на те, которые пользователь любил в прошлом или изучает в настоящее время. Он не полагается на механизм входа пользователя в систему для создания этого часто временного профиля. В частности, различные элементы-кандидаты сравниваются с элементами, ранее оцененными пользователем, и рекомендуются наиболее подходящие элементы. Этот подход уходит корнями в поиск информации и исследования фильтрации информации .

Для создания профиля пользователя система в основном фокусируется на двух типах информации:

1. Модель предпочтений пользователя.

2. История взаимодействия пользователя с рекомендательной системой.

По сути, эти методы используют профиль элемента (т. Е. Набор дискретных атрибутов и функций), характеризующий элемент в системе. Чтобы абстрагироваться от характеристик элементов в системе, применяется алгоритм представления элементов. Широко используемым алгоритмом является представление tf – idf (также называемое представлением в векторном пространстве). Система создает профиль пользователей, основанный на содержании, на основе взвешенного вектора характеристик элемента. Веса обозначают важность каждой функции для пользователя и могут быть вычислены на основе индивидуально оцененных векторов контента с использованием различных методов. Простые подходы используют средние значения вектора оцененных элементов, в то время как другие сложные методы используют методы машинного обучения, такие как байесовские классификаторы , кластерный анализ , деревья решений и искусственные нейронные сети , чтобы оценить вероятность того, что элемент понравится пользователю.

Ключевой проблемой фильтрации на основе содержимого является то, может ли система узнать предпочтения пользователя по действиям пользователей в отношении одного источника содержимого и использовать их в других типах содержимого. Когда система ограничена рекомендацией контента того же типа, который уже использует пользователь, значение из системы рекомендаций значительно меньше, чем когда можно рекомендовать другие типы контента из других служб. Например, рекомендовать новостные статьи на основе просмотра новостей полезно, но было бы гораздо полезнее, когда можно рекомендовать музыку, видео, продукты, обсуждения и т. Д. Из различных служб на основе просмотра новостей. Чтобы преодолеть это, большинство рекомендательных систем, основанных на содержании, теперь используют некоторую форму гибридной системы.

Рекомендательные системы, основанные на содержании, также могут включать рекомендательные системы, основанные на мнениях. В некоторых случаях пользователям разрешается оставлять текстовые обзоры или отзывы о товарах. Эти созданные пользователем тексты являются неявными данными для рекомендательной системы, поскольку они потенциально являются богатым ресурсом как по характеристикам / аспектам элемента, так и по оценке / настроению пользователей по отношению к элементу. Функции, извлеченные из обзоров, созданных пользователями, являются улучшенными метаданными элементов, поскольку, поскольку они также отражают такие аспекты элемента, как метаданные , извлеченные функции широко используются пользователями. Мнения, извлеченные из обзоров, можно рассматривать как оценки пользователей по соответствующим функциям. Популярные подходы системы рекомендаций на основе мнений используют различные методы, включая интеллектуальный анализ текста , поиск информации , анализ настроений (см. Также многомодальный анализ настроений ) и глубокое обучение.

Рекомендательные системы на основе сеансов

Эти рекомендательные системы используют взаимодействие пользователя в течение сеанса для выработки рекомендаций. Системы рекомендаций на основе сеансов используются на Youtube и Amazon. Это особенно полезно, когда история (например, прошлые клики, покупки) пользователя недоступна или не актуальна в текущем сеансе пользователя. Области, в которых рекомендации на основе сеансов особенно актуальны, включают видео, электронную коммерцию, путешествия, музыку и многое другое. Большинство экземпляров рекомендательных систем на основе сеанса полагаются на последовательность недавних взаимодействий в рамках сеанса, не требуя каких-либо дополнительных сведений (исторических, демографических) о пользователе. Методы для рекомендаций на основе сеансов в основном основаны на генеративных последовательных моделях, таких как рекуррентные нейронные сети, преобразователи и другие подходы, основанные на глубоком обучении.

Обучение с подкреплением для рекомендательных систем

Проблема рекомендации может рассматриваться как особый случай проблемы обучения с подкреплением, при которой пользователь является средой, в которой действует агент, система рекомендаций, чтобы получить вознаграждение, например, щелчок или взаимодействие пользователя. Одним из аспектов обучения с подкреплением, которое особенно полезно в области рекомендательных систем, является тот факт, что модели или политики могут быть изучены путем предоставления вознаграждения рекомендательному агенту. В этом отличие от традиционных методов обучения, которые основываются на подходах к контролируемому обучению, которые являются менее гибкими, рекомендательные методы обучения с подкреплением позволяют потенциально обучать модели, которые можно оптимизировать непосредственно на основе показателей вовлеченности и интереса пользователей.

Многокритериальные рекомендательные системы

Многокритериальные рекомендательные системы (MCRS) можно определить как рекомендательные системы, которые включают информацию о предпочтениях по множеству критериев. Вместо разработки методов рекомендаций, основанных на единственном значении критерия, общем предпочтении пользователя u для элемента i, эти системы пытаются предсказать рейтинг для неизученных элементов u, используя информацию о предпочтениях по множеству критериев, которые влияют на это общее значение предпочтения. Некоторые исследователи подходят к MCRS как к проблеме принятия многокритериальных решений (MCDM) и применяют методы и методы MCDM для реализации систем MCRS. См. Эту главу для расширенного введения.

Системы рекомендаций с учетом рисков

Большинство существующих подходов к рекомендательным системам сосредоточены на том, чтобы рекомендовать пользователям наиболее релевантный контент с использованием контекстной информации, но не принимают во внимание риск побеспокоить пользователя нежелательными уведомлениями. Важно учитывать риск расстроить пользователя, выдвигая рекомендации при определенных обстоятельствах, например, во время профессиональной встречи, рано утром или поздно ночью. Следовательно, эффективность рекомендательной системы частично зависит от степени, в которой она учла риск в процессе рекомендаций. Одним из вариантов решения этой проблемы является система DRARS , которая моделирует контекстно- зависимую рекомендацию как проблему бандита . Эта система сочетает в себе контентную технику и контекстный алгоритм бандитов.

Мобильные рекомендательные системы

Мобильные рекомендательные системы используют смартфоны с доступом в Интернет, чтобы предлагать персонализированные, контекстно-зависимые рекомендации. Это особенно сложная область исследования, поскольку мобильные данные сложнее данных, с которыми часто приходится иметь дело рекомендательным системам. Он неоднороден, зашумлен, требует пространственной и временной автокорреляции и имеет проблемы с валидацией и общностью.

Есть три фактора, которые могут повлиять на мобильные рекомендательные системы и точность результатов прогнозирования: контекст, метод рекомендации и конфиденциальность. Кроме того, мобильные рекомендательные системы страдают от проблемы трансплантации - рекомендации могут применяться не во всех регионах (например, было бы неразумно рекомендовать рецепт в области, где все ингредиенты могут быть недоступны).

Одним из примеров мобильной рекомендательной системы являются подходы, применяемые такими компаниями, как Uber и Lyft, для создания маршрутов движения для водителей такси в городе. Эта система использует данные GPS о маршрутах, по которым таксисты выбирают во время работы, включая местоположение (широту и долготу), отметки времени и рабочее состояние (с пассажирами или без них). Он использует эти данные, чтобы рекомендовать список пунктов выдачи на маршруте с целью оптимизации времени занятости и прибыли.

Гибридные рекомендательные системы

В большинстве рекомендательных систем сейчас используется гибридный подход, сочетающий совместную фильтрацию , фильтрацию на основе содержимого и другие подходы. Нет никаких причин, по которым нельзя было бы гибридизировать несколько различных методов одного и того же типа. Гибридные подходы могут быть реализованы несколькими способами: путем раздельного прогнозирования на основе контента и на основе совместной работы с последующим их объединением; путем добавления возможностей, основанных на содержании, к подходу, основанному на сотрудничестве (и наоборот); или путем объединения подходов в одну модель (см. полный обзор рекомендательных систем). Несколько исследований, которые эмпирически сравнивают производительность гибрида с чистыми методами совместной работы и методами, основанными на содержании, и продемонстрировали, что гибридные методы могут дать более точные рекомендации, чем чистые подходы. Эти методы также можно использовать для преодоления некоторых общих проблем в рекомендательных системах, таких как холодный запуск и проблема разреженности, а также узкое место инженерии знаний в подходах, основанных на знаниях .

Netflix - хороший пример использования гибридных рекомендательных систем. Веб-сайт дает рекомендации, сравнивая привычки просмотра и поиска похожих пользователей (например, совместная фильтрация), а также предлагая фильмы, которые имеют общие характеристики с фильмами, получившими высокую оценку пользователя (фильтрация на основе контента).

Некоторые методы гибридизации включают:

  • Взвешенный : численное объединение оценок различных компонентов рекомендации.
  • Переключение : выбор среди рекомендуемых компонентов и применение выбранного.
  • Смешанный : рекомендации от разных рекомендателей представлены вместе, чтобы дать рекомендацию.
  • Комбинация функций : функции, полученные из разных источников знаний, объединяются и передаются в единый алгоритм рекомендаций.
  • Расширение функций : вычисление функции или набора функций, которые затем являются частью исходных данных для следующего метода.
  • Каскад : рекомендателям отдается строгий приоритет, при этом те, которые имеют более низкий приоритет, разрывают ничью при подсчете очков с более высокими.
  • Мета-уровень : применяется один рекомендательный метод и создается своего рода модель, которая затем используется в следующей технике.

Приз Netflix

Одним из событий, которые стимулировали исследования в области рекомендательных систем, стала премия Netflix . С 2006 по 2009 год Netflix спонсировал конкурс, предлагая главный приз в размере 1000000 долларов команде, которая могла взять предложенный набор данных из более чем 100 миллионов оценок фильмов и выдать рекомендации, которые были на 10% точнее, чем те, которые предлагает существующая система рекомендаций компании. Этот конкурс стимулировал поиск новых и более точных алгоритмов. 21 сентября 2009 года главный приз в размере 1 000 000 долларов США был присужден команде BellKor Pragmatic Chaos по правилам тай-брейка.

Самый точный алгоритм 2007 года использовал метод ансамбля из 107 различных алгоритмических подходов, объединенных в один прогноз. Как заявили победители, Белл и др .:

Точность прогнозирования существенно повышается при смешивании нескольких предикторов. Наш опыт показывает, что большинство усилий следует сосредоточить на разработке существенно разных подходов, а не на совершенствовании единой техники. Следовательно, наше решение представляет собой совокупность многих методов.

Благодаря проекту Netflix Интернет получил множество преимуществ. Некоторые команды взяли свои технологии и применили их на других рынках. Некоторые члены команды, занявшей второе место, основали Gravity R&D , механизм рекомендаций, который активно участвует в сообществе RecSys. 4-Tell, Inc. создала решение на основе проекта Netflix для веб-сайтов электронной коммерции.

В связи с набором данных, предложенным Netflix для конкурса Netflix Prize, возник ряд проблем с конфиденциальностью . Хотя наборы данных были анонимными, чтобы сохранить конфиденциальность клиентов, в 2007 году два исследователя из Техасского университета смогли идентифицировать отдельных пользователей, сопоставив наборы данных с рейтингами фильмов в базе данных Internet Movie Database. В результате в декабре 2009 года анонимный пользователь Netflix подал в суд на Netflix в деле Doe v. Netflix, утверждая, что Netflix нарушила законы США о справедливой торговле и Закон о защите конфиденциальности видео, опубликовав наборы данных. Это, а также опасения Федеральной торговой комиссии , привели к отмене второго конкурса Netflix Prize в 2010 году.

Показатели эффективности

Оценка важна для оценки эффективности алгоритмов рекомендаций. Для измерения эффективности рекомендательных систем и сравнения различных подходов доступны три типа оценок : пользовательские исследования, онлайн-оценки (A / B-тесты) и офлайн-оценки.

Обычно используемые метрики - это среднеквадратичная ошибка и среднеквадратичная ошибка , последняя из которых использовалась в конкурсе Netflix Prize. Метрики поиска информации, такие как точность и отзыв или DCG , полезны для оценки качества метода рекомендаций. Разнообразие, новизна и охват также считаются важными аспектами при оценке. Однако многие классические методы оценки подвергаются резкой критике.

Оценка производительности алгоритма рекомендаций на фиксированном наборе тестовых данных всегда будет чрезвычайно сложной задачей, поскольку невозможно точно предсказать реакцию реальных пользователей на рекомендации. Следовательно, любая метрика, которая вычисляет эффективность алгоритма в автономных данных, будет неточной.

Исследования пользователей довольно малы. Нескольким десяткам или сотням пользователей представлены рекомендации, созданные с помощью различных подходов к рекомендациям, а затем пользователи решают, какие рекомендации являются лучшими.

В A / B-тестах рекомендации обычно показываются тысячам пользователей реального продукта, и рекомендательная система случайным образом выбирает по крайней мере два различных подхода к рекомендациям для генерации рекомендаций. Эффективность измеряется неявными мерами эффективности, такими как коэффициент конверсии или рейтинг кликов .

Автономные оценки основаны на исторических данных, например на наборе данных, который содержит информацию о том, как пользователи ранее оценивали фильмы.

Затем эффективность рекомендательных подходов измеряется на основе того, насколько хорошо рекомендательный подход может предсказать рейтинги пользователей в наборе данных. Хотя рейтинг является явным выражением того, понравился ли фильм пользователю, такая информация доступна не во всех доменах. Например, в области систем рекомендаций по цитированию пользователи обычно не оценивают цитирование или рекомендованную статью. В таких случаях офлайн-оценки могут использовать неявные меры эффективности. Например, можно предположить, что эффективна рекомендательная система, способная рекомендовать как можно больше статей, содержащихся в списке ссылок на исследовательскую статью. Однако многие исследователи считают подобные офлайн-оценки критическими. Например, было показано, что результаты автономных оценок имеют низкую корреляцию с результатами пользовательских исследований или A / B-тестов. Было показано, что набор данных, популярный для автономной оценки, содержит повторяющиеся данные и, таким образом, приводит к неправильным выводам при оценке алгоритмов. Часто результаты так называемых автономных оценок не коррелируют с фактически оцененной степенью удовлетворенности пользователей. Вероятно, это связано с тем, что автономное обучение сильно смещено в сторону высокодоступных элементов, а данные автономного тестирования сильно зависят от результатов работы модуля онлайн-рекомендаций. Исследователи пришли к выводу, что к результатам офлайн-оценок следует относиться критически.

За пределами точности

Обычно исследования рекомендательных систем направлены на поиск наиболее точных алгоритмов рекомендаций. Однако есть ряд факторов, которые также важны.

  • Разнообразие - пользователи, как правило, больше удовлетворяются рекомендациями, когда существует большее разнообразие внутри списка, например, предметы от разных художников.
  • Настойчивость рекомендателя - в некоторых ситуациях более эффективно повторно показать рекомендации или позволить пользователям повторно оценить элементы, чем показывать новые элементы. На это есть несколько причин. Пользователи могут игнорировать элементы, когда они отображаются впервые, например, потому что у них не было времени внимательно изучить рекомендации.
  • Конфиденциальность - рекомендательным системам обычно приходится иметь дело с проблемами конфиденциальности, потому что пользователи должны раскрывать конфиденциальную информацию. Создание профилей пользователей с использованием совместной фильтрации может быть проблематичным с точки зрения конфиденциальности. Во многих европейских странах существует сильная культура конфиденциальности данных , и каждая попытка ввести любой уровень профилирования пользователей может привести к отрицательной реакции клиентов. В этой области было проведено много исследований по текущим вопросам конфиденциальности. Приз Netflix особенно примечателен подробной личной информацией, опубликованной в его наборе данных. Рамакришнан и др. провели обширный обзор компромиссов между персонализацией и конфиденциальностью и обнаружили, что сочетание слабых связей (неожиданное соединение, которое дает случайные рекомендации) и других источников данных можно использовать для раскрытия личности пользователей в анонимизированном наборе данных.
  • Демографические данные пользователей - Beel et al. обнаружили, что демографические данные пользователей могут влиять на то, насколько пользователи удовлетворены рекомендациями. В своей статье они показывают, что пожилые пользователи, как правило, больше заинтересованы в рекомендациях, чем молодые.
  • Надежность - когда пользователи могут участвовать в рекомендательной системе, необходимо решить проблему мошенничества.
  • Интуиция - Интуиция - это мера того, «насколько удивительны рекомендации». Например, система рекомендаций, которая рекомендует молоко покупателю в продуктовом магазине, может быть совершенно точной, но это не очень хорошая рекомендация, потому что это очевидный товар для покупателя. «[Serenditipity] служит двум целям: во-первых, уменьшается вероятность того, что пользователи потеряют интерес из-за слишком единообразного набора вариантов. Во-вторых, эти элементы необходимы для того, чтобы алгоритмы учились и совершенствовались».
  • Доверие - рекомендательная система не имеет большого значения для пользователя, если он не доверяет системе. Доверие можно создать с помощью рекомендательной системы, объяснив, как она генерирует рекомендации и почему рекомендует тот или иной предмет.
  • Маркировка - на удовлетворенность пользователей рекомендациями может влиять маркировка рекомендаций. Например, в цитируемом исследовании кликов (CTR) для рекомендаций помеченных как «Sponsored» были ниже (CTR = 5,93%) по сравнению с CTR для идентичных рекомендаций помеченных как «Organic» (CTR = 8,86%). Рекомендации без маркировки показали себя наилучшим образом (CTR = 9,87%) в этом исследовании.

Воспроизводимость

Общеизвестно, что рекомендательные системы сложно оценивать в автономном режиме, и некоторые исследователи утверждают, что это привело к кризису воспроизводимости публикаций рекомендательных систем. Недавний обзор небольшого числа избранных публикаций, применяющих методы глубокого обучения или нейронных методов для решения топ-k проблем рекомендаций, опубликованных на ведущих конференциях (SIGIR, KDD, WWW, RecSys, IJCAI), показал, что в среднем менее 40% статьи могли быть воспроизведены авторами опроса, на некоторых конференциях их доля составляла всего 14%. Всего в исследованиях было выявлено 26 статей, только 12 из них могли быть воспроизведены авторами, а 11 из них могли превзойти гораздо более старые и более простые, правильно настроенные исходные данные о показателях автономной оценки. В статьях рассматривается ряд потенциальных проблем современной исследовательской науки и предлагается усовершенствовать научную практику в этой области. Более поздняя работа по тестированию набора тех же методов привела к качественно очень разным результатам, в результате чего нейронные методы были признаны одними из самых эффективных. Глубокое обучение и нейронные методы для рекомендательных систем использовались в выигрышных решениях в нескольких недавних задачах рекомендательных систем, WSDM, RecSys Challenge. Кроме того, нейронные методы и методы глубокого обучения широко используются в промышленности, где они тщательно тестируются. Тема воспроизводимости не нова в рекомендательных системах. К 2011 году Экстранд, Констан и др. критиковал, что «в настоящее время трудно воспроизвести и расширить результаты исследований рекомендательных систем», и что оценки «не обрабатываются последовательно». Констан и Адомавичус заключают, что «исследовательское сообщество рекомендующих систем сталкивается с кризисом, когда значительное количество статей представляет результаты, которые мало способствуют накоплению коллективных знаний […] часто из-за того, что исследованию не хватает […] оценки для правильной оценки и, следовательно, для внесения значимого вклада ". Как следствие, многие исследования рекомендательных систем можно считать невоспроизводимыми. Следовательно, операторы рекомендательных систем находят в текущих исследованиях мало указаний для ответа на вопрос, какие рекомендательные подходы использовать в рекомендательных системах. Said & Bellogín провели исследование статей, опубликованных в данной области, а также провели сравнительный анализ некоторых из самых популярных структур для выработки рекомендаций и обнаружили значительные несоответствия в результатах, даже когда использовались одни и те же алгоритмы и наборы данных. Некоторые исследователи продемонстрировали, что незначительные вариации в алгоритмах рекомендаций или сценариях приводят к сильным изменениям в эффективности рекомендательной системы. Они приходят к выводу, что для улучшения текущей ситуации необходимы семь действий: «(1) изучить другие области исследований и извлечь из них уроки, (2) найти общее понимание воспроизводимости, (3) определить и понять детерминанты, которые влияют на воспроизводимость, (4) ) проводить более всесторонние эксперименты (5) модернизировать практику публикации, (6) способствовать развитию и использованию рамок рекомендаций и (7) устанавливать руководящие принципы передовой практики для исследования рекомендательных систем ".

Смотрите также

использованная литература

дальнейшее чтение

Книги

Ким Фальк (январь 2019 г.), Практические рекомендательные системы, Manning Publications, ISBN  9781617292705

Научные статьи

внешние ссылки