Совместная фильтрация элементов данных - Item-item collaborative filtering

Совместная фильтрация по элементам , или по элементам , или по элементам , является формой совместной фильтрации для рекомендательных систем, основанной на сходстве элементов, вычисленных с использованием оценок этих элементов людьми. Совместная фильтрация элементов данных была изобретена и использована Amazon.com в 1998 году. Впервые она была опубликована на научной конференции в 2001 году.

Более ранние системы совместной фильтрации, основанные на схожести оценок между пользователями (известная как совместная фильтрация пользователь-пользователь ), имели несколько проблем:

  • системы работали плохо, когда у них было много элементов, но сравнительно мало оценок
  • вычисление сходства между всеми парами пользователей было дорогостоящим
  • профили пользователей изменились быстро, и пришлось пересчитывать всю модель системы

Модели элемент-элемент решают эти проблемы в системах, в которых пользователей больше, чем элементов. В моделях элемент-элемент используется распределение рейтингов по элементам , а не по пользователям . При большем количестве пользователей, чем элементов, каждый элемент имеет больше оценок, чем каждый пользователь, поэтому средний рейтинг элемента обычно не меняется быстро. Это приводит к более стабильному распределению рейтингов в модели, поэтому ее не нужно перестраивать так часто. Когда пользователи потребляют и затем оценивают элемент, аналогичные элементы этого элемента выбираются из существующей модели системы и добавляются в рекомендации пользователя.

Метод

Сначала система выполняет этап построения модели, обнаруживая сходство между всеми парами элементов. Эта функция подобия может принимать различные формы, такие как корреляция между рейтингами или косинус этих рейтинговых векторов. Как и в системах пользователь-пользователь, функции подобия могут использовать нормализованные оценки (корректируя, например, среднюю оценку каждого пользователя).

Во-вторых, система выполняет этап рекомендации . Он использует элементы, наиболее похожие на элементы, уже оцененные пользователем, для создания списка рекомендаций. Обычно этот расчет представляет собой взвешенную сумму или линейную регрессию . Эта форма рекомендации аналогична тому, что «люди, которые высоко оценивают элемент X, как и вы, также склонны высоко оценивать элемент Y, а вы еще не оценили элемент Y, поэтому вам следует попробовать».

Полученные результаты

Совместная фильтрация элемент-элемент имела меньше ошибок, чем совместная фильтрация пользователь-пользователь. Кроме того, его менее динамичная модель вычислялась реже и сохранялась в матрице меньшего размера, поэтому производительность системы элемент-элемент была лучше, чем у систем пользователь-пользователь.

Рекомендации