Рост электронного бизнеса за последние несколько десятилетий и рост многонациональных компаний, таких как Alphabet, Amazon, Netflix, Alibaba и множества других подобных компаний, предоставляющих веб-услуги, привели к тому, что потребность в рекомендательных системах со временем растет в геометрической прогрессии. От электронной коммерции (предложение продуктов, которые могут заинтересовать клиентов) до онлайн-рекламы и подбора любовников, рекомендательные системы сегодня неизбежны в нашей повседневной жизни.

В общем, рекомендательные системы направлены на то, чтобы дать пользователю наиболее подходящие предложения, чтобы увеличить количество покупок, а также обеспечить восхитительный опыт.

На практике рекомендательные системы имеют два или три основных типа: совместная фильтрация, фильтрация на основе контента и, наконец, гибридная фильтрация. В них используются довольно сложные принципы, такие как матричная факторизация, ближайший сосед, евклидово расстояние и другие. Тем не менее, в этом блоге делается попытка изучить более простую рекомендательную систему, которая давала бы аналогичные результаты в тех областях, где у компании мало продуктов.

С помощью этого метода мы проходим три основных этапа: понимание и выбор соответствующих характеристик пользователя, ранжирование каждой отдельной характеристики и, наконец, расширение ранжирования на целевых пользователей. Важно отметить, что такие компании, как Washington Post, использовали аналогичную систему в своей онлайн-системе бумажных платежей.

Понимание и выбор релевантных пользовательских характеристик

Здесь мы смотрим на текущих пользователей определенного продукта и понимаем, какие характеристики лучше всего описывают их поведение, это могут быть их возраст, пол, структура расходов, местоположение и другие. Этот процесс может быть выполнен на основе опыта работы с продуктом и пользователями или на основе определения важности функций, когда различные атрибуты вводятся в модель, например модель классификации. Сообщение ниже может дать лучшее понимание того же самого.



Как только мы получим соответствующие функции или характеристики, мы сможем построить таблицу, которая имеет схожие функции как для наших пользователей, так и для целевых пользователей.

Ранжирование категорий по каждой отдельной характеристике

На этом этапе мы рассматриваем каждую функцию и пытаемся ранжировать содержимое на основе того, сколько людей среди наших пользователей относят к этой категории. Например, если нашей характеристикой является возрастная группа, мы смотрим на текущих пользователей и подсчитываем отдельных пользователей для каждой возрастной группы. При этом мы понимаем, что, например, пользователи в возрасте от 18 до 30 покупают продукт больше и получают наивысший рейтинг, как показано ниже.

Это дает нам базовые ранги, которые мы собираемся применить на следующем шаге.

Расширение рейтинга для целевых пользователей

После того, как мы хорошо настроим наши целевые ранги для различных характеристик, мы постараемся распространить эти ранги на целевых пользователей. При этом каждому участнику присваивается ранг, аналогичный рангу из наших целевых рангов, в зависимости от категории, которой он обладает в рамках общих характеристик.

Например, всем участникам в возрасте от 18 до 30 лет присваивается 4-й ранг, чтобы показать, что они больше всего похожи на пользователей нашего продукта, а 3-й ранг — тем, кому от 31 до 45 лет, и так далее. Когда у нас есть матрица рангов, заполненная для всех целевых пользователей на основе базовых рангов, мы добавляем ранги, чтобы получить общий ранг для каждого пользователя.

Затем мы получаем общий базовый ранг, добавляя самые высокие ранги по каждой характеристике. Затем мы делим общий рейтинг каждого пользователя на общий базовый рейтинг, чтобы получить вероятность покупки продукта.

В зависимости от порога, установленного компанией, можно выбрать таргетинг на всех пользователей с вероятностью выше 70%, и уровень отклика должен быть более привлекательным по сравнению с тем, когда все пользователи нацелены на один и тот же продукт. В качестве альтернативы рекомендация может быть сегментирована, чтобы рассматривать различных клиентов отдельно с точки зрения того, какой подход используется для рекомендации им продукта и, таким образом, стимулирования роста покупок продукта.

Наконец, метод сталкивается с трудностями, когда рекомендуемый продукт является новым для компании (холодный старт). Этого можно избежать, объединяя продукты в темы, и все эти продукты с одной и той же темой могут использовать базовые ранги похожих продуктов.

Спасибо за чтение