Машинное обучение: попытки дать рекомендации

Этот пост является частью серии, представляющей Algorithm Explorer: платформу для изучения того, какие методы науки о данных связаны с потребностями вашего бизнеса.

Вводный пост Машинное обучение: с чего начать… можно найти здесь, а Обозреватель алгоритмов - здесь.

Если вы хотите использовать машинное обучение для составления рекомендаций, вам следует обратиться к методам работы с ядром рекомендаций.

Совместная фильтрация на основе памяти

Совместная фильтрация - это метод прогнозирования интереса пользователя путем анализа предпочтений других пользователей. Существует два типа: фильтрация на основе пользователей и фильтрация на основе элементов.

Фильтрация на основе памяти вычисляет сходство между пользователями или элементами, чтобы сделать прогноз. Типичный подход - алгоритм на основе соседства; s мера сходства определяет пользователей, наиболее похожих на пользователя, или элементы по отношению к элементам, уже оцененным пользователем. Прогнозируемая оценка для элемента может быть рассчитана путем объединения собранных оценок, возможно, взвешивания каждой по значению сходства. .

Плюсы

Быстро внедрить
Результаты интерпретируемы
Предложения, основанные на пользователях, могут приводить к разнообразному набору предложений для разных доменов.

Минусы

Редкость данных может привести к проблемам с производительностью
Медленный и дорогостоящий с точки зрения вычислений - для прогноза требуется весь набор данных.
«Проблема с холодным запуском» - новые элементы сложно рекомендовать (смещение популярности), а новым пользователям с небольшой историей сложно давать рекомендации.

Словарь

Фильтрация на основе пользователей. Фильтрация на основе пользователей рекомендует пользователю продукты, которые понравились аналогичным пользователям.

Фильтрация по элементам. Фильтрация по элементам позволяет выявлять похожие элементы на основе ранее понравившихся.

Алгоритм на основе соседства - мера сходства определяет пользователей, наиболее похожих на пользователя, или элементы, наиболее похожие на элементы, уже оцененные пользователем. Они называются «окрестностями», как если бы вы построили точки данных, это были бы самые близкие

Мера сходства - функция, позволяющая количественно оценить сходство между объектами, например косинусное сходство

Объединение - это способ объединения данных, который обычно осуществляется путем взятия среднего среднего значения.

Взвешивание. Если вы взвешиваете значение, вы назначаете ему корректировку на основе его важности. При объединении вместо усреднения значений каждое значение можно умножить на пропорциональное расстояние от интересующего элемента.

Совместная фильтрация на основе моделей

Фильтрация на основе моделей использует данные обучения пользователей, элементы и рейтинги для построения прогнозирующей модели. Существует множество алгоритмов, в том числе нейронные сети, байесовские сети и матричная факторизация. .

Плюсы

Быстрый и масштабируемый; не требует каждый раз полный набор данных
Предложения, основанные на пользователях, могут приводить к разнообразному набору предложений для разных доменов.
Предложения на основе пользователей не требуют метаданных

Минусы

Редкость данных может привести к проблемам с производительностью
Модели могут быть сложными и медленными для обучения
«Проблема с холодным запуском» - новые элементы сложно рекомендовать (смещение популярности), а новым пользователям с небольшой историей сложно давать рекомендации.

Словарь

Модель. Алгоритмы машинного обучения создают модель после обучения. Это математическая функция, которую затем можно использовать для получения нового наблюдения и расчета соответствующего прогноза.

Нейронные сети. Нейронные сети могут изучать сложные шаблоны, используя «скрытые слои» между входами и выходами. Эти слои состоят из нейронов, которые математически преобразуют данные.

Байесовские сети. Байесовская сеть - это графическая сеть, в которой узлы являются переменными, а ребра - условной зависимостью между ними.

Факторизация матрицы. В контексте совместной фильтрации матричная факторизация пытается найти матрицу для пользователей и матрицу для элементов, которая при умножении приближается к исходной таблице оценок.

Дальнейшее чтение

Другие публикации из этой серии:

Огромное спасибо

Я хочу поблагодарить Сэма Роуза за его отличную работу по разработке интерфейса (и терпение!), Превратив мою необработанную идею в нечто гораздо более удобное, оптимизированное и эстетически приятное.

Точно так же мои навыки рисования оставляют желать лучшего, поэтому спасибо Мэри Ким за то, что добавили художественной изюминки в эту работу!

Машинное обучение: попытки дать рекомендации

Рекомендации Engine

Случаи применения

Наиболее распространенные методы механизма рекомендаций

Рекомендации на основе содержания

Плюсы

Минусы

Словарь

Совместная фильтрация на основе памяти

Плюсы

Минусы

Словарь

Совместная фильтрация на основе моделей

Плюсы

Минусы

Словарь

Дальнейшее чтение

Огромное спасибо

Машинное обучение: попытки дать рекомендации

Рекомендации Engine

Случаи применения

Наиболее распространенные методы механизма рекомендаций

Рекомендации на основе содержания

Плюсы

Минусы

Словарь

Совместная фильтрация на основе памяти

Плюсы

Минусы

Словарь

Совместная фильтрация на основе моделей

Плюсы

Минусы

Словарь

Дальнейшее чтение

Огромное спасибо

Похожие вопросы