Постановка проблемы / Аннотация. Все веб-сайты электронной коммерции полагаются на системы рекомендаций для продвижения своих продуктов и увеличения продаж. Некоторые из проблем, с которыми сталкивается текущая система рекомендаций, связаны с тем, что продукты, которые были куплены, снова рекомендуются, образец поведения покупателя не фиксируется должным образом, а учитываются только история поиска и кеш. Во многих вероятностных ситуациях рекомендуемые товары могут не входить в диапазон покупок пользователей или их вкусы, то есть они могли искать из случайного любопытства. Наше решение пытается исправить недостатки существующих систем и пытается снизить процент ошибок.

Generics. Наше решение включает разбиение группы клиентов на следующие категории:

Мы можем сформулировать на основе - интересов страниц, времени, проведенного на каждой странице и последовательности посещений, определить категории пользователей:

Для "Затраченное время" задается как t1, t2, t3… tn.

Идентификатор страницы задается как P1, P2, P3,… Pn.

Веса задаются WP1, WP2, WP3,… WPn в соответствии с конкретным типом страниц (а именно, обзоры, рейтинги, корзина и т. Д.)

Последовательность = WP1 * P1 * t1 + WP2 * P2 * t2 +… + WPn * Pn * tn

Наряду с встраиванием последовательностей при кластеризации также будет учитываться профиль пользователей.

1. Несерьезный / случайный браузер. Пользователи, принадлежащие к этой группе, обычно просматривают несколько каналов, основываясь на одном элементе или нескольких элементах, для получения общей информации или поиска более дешевых тарифов.

2. Ищете более дешевый продукт. Пользователи, принадлежащие к этой группе, как правило, ищут одинаковые или похожие продукты в разных каналах для снижения цен и скидок. Это может быть что угодно, что принесет пользователям денежную выгоду.

3. Серьезные покупатели. Пользователи, отнесенные к определенной категории, либо продолжают исследования продуктов по различным каналам, либо анализируют их с помощью рейтингов и обзоров продуктов.

4. Импульсивные покупатели: категория покупателей, которые редко заинтересованы в подробном анализе продуктов, но получают их случайно.

5. Недавно зарегистрированные: группа покупателей, которые недавно зарегистрировались на платформе.

Кластеры будут отражать основное поведение продавца, просмотры страниц, подробные данные о покупках, чтобы прийти к выводу о рекомендации продуктов на основе кластеров, к которым они принадлежат. Например, если покупатель относится к категории «Ищет более дешевый продукт» и ищет продукт «А», это решение попытается найти тот же самый и связанный с ним продукт, на который действует скидка. Для «серьезного покупателя» рекомендация будет основываться на отзывах, цене, категории покупки, качестве продавца. Кроме того, мы будем рекомендовать продукт, который будет в наличии на данный момент или может быть предварительно заказан.

Использование дерева в модели «мешок слов»: общая модель «мешок слов» требуется для классификации продуктов в виде дерева, где классы могут быть назначены разным группам продуктов. Иерархия может быть назначена на основе классов продуктов, в конечном итоге, вплоть до уровня объекта. В качестве пояснительного примера для приведенных выше утверждений может быть следующий: «Электроника» может быть родительским классом, за которым следуют «Компьютеры / Ноутбуки», за которыми следуют различные марки и модели. Сразу после иерархии классов должны быть объекты, которые определяются моделью / продуктами и артикулами. Филиал будет там как дочерний узел для ноутбуков и компьютеров, где он будет предоставлять информацию о том, какие последующие элементы связаны с родительским узлом. Такие аксессуары, как мышь, коврик для мыши, наушники, чехлы и т. Д., Покупаются после покупки компьютера. Следовательно, рекомендация после покупки компьютера может быть легко и мгновенно сформирована. Итак, если иерархия такая: Компьютер → Мышь → Коврик для мыши, то при покупке мыши должна отображаться рекомендация коврика для мыши, а не компьютера.

Лес продуктов: объединение нескольких деревьев на основе типов продуктов, таких как корни и последующие дочерние элементы. Конечный элемент класса будет содержать связанные объекты и, наконец, он будет содержать элементы под теми же объектами, что и те же элементы или модели. Наконец-то модели привязаны к артикулам.

Псевдокод:

Родительский узел ‹- Родительский класс продукта

Дочерний узел ‹- Дочерний класс продукта

Узел-брат ‹- Класс продукта-родственника / родственного продукта

Дочерний узел ‹- Дочерние товары

Несколько примеров рекомендаций на основе кластерной группы пользователей:

1. Рекомендации для серьезных групп пользователей: Классификация пользователей основана на поведенческих данных, собранных в форме кеша. Он включает время посещения страницы, время, потраченное на обзоры, время, потраченное на описание продукта, проверку похожих элементов, продолжительность, время и позиции кликов, а также другие анализируемые элементы.

а. Рекомендуемые продукты: они могут быть основаны на непосредственных элементах поиска и просмотрах в разных каналах. Второй уровень может быть выполнен на основе более ранних предпочтений и предпочтений других подобных пользователей (совместная фильтрация). Продукты, в которых проводился поиск, а также продукты ближайших родственников из иерархии также могут быть выдвинуты в качестве рекомендации. Таким образом, окончательная рекомендация не полностью основана на других подобных пользователях, но зависит от их поведения. Это уменьшает количество ошибок и неверных прогнозов.

б. Рекомендации после покупки - в зависимости от типа продукта и отдельного продукта последующие дочерние элементы могут быть выбраны из дерева и рекомендованы пользователю для следующей покупки. Аналогичный процесс можно повторить также в зависимости от содержания поиска.

2. Ищете более дешевый продукт: классификация пользователей на основе пути пользователя на основе возможной тенденции, ведущей к обзорам продуктов, рейтинги продуктов, связанный продукт, анализ ценового диапазона и частота посещений страницы продукта и время, проведенное на странице просмотра продукта, добавьте в корзину, рейтинг / балл профиля покупки пользователя и поиск похожих и более дешевых товаров

а. Рекомендация продукта: исходя из ценового диапазона аналогичных продуктов. Прогноз также будет производиться из Product Forest, что снизит временную сложность рекомендации, добавив фильтры, которые будут применяться к имеющимся в наличии товарам.

б. Рекомендации после покупки: в зависимости от типа продукта и отдельного продукта последующие дочерние элементы могут быть выбраны из дерева и рекомендованы пользователю для следующей покупки. Аналогичный процесс можно повторить также в зависимости от содержания поиска.

3. Импульсивные покупатели: классификация пользователей на основе пути пользователя на основе возможной тенденции, ведущей к обзорам продуктов, рейтинги продуктов, связанные продукты, анализ ценового диапазона, частота посещений страницы продукта и время, проведенное на странице просмотра продукта, добавить в корзину. , рейтинг / оценка профиля покупки пользователя и поиск похожих и более дешевых продуктов

а. Рекомендуемый продукт: на основе времени, проведенного на странице, можно делать прогнозы с похожими элементами из дерева продуктов, основываясь на предыдущем продукте, который искали, и на основе наиболее предпочтительных ценовых диапазонов.

б. Рекомендации после покупки: в зависимости от типа продукта и отдельного продукта последующие дочерние элементы могут быть выбраны из дерева и рекомендованы пользователю для следующей покупки с дополнительным фильтром ценового диапазона и покупательского поведения пользователей. Аналогичный процесс можно повторить также в зависимости от содержания поиска.

c. Рекомендации должны быть общими и нацелены на доступные ценовые группы плюс аналогичные товары, которые пользователь пытается купить.

Архитектура

Данные состоят из набора функций SQL / No SQL. - Возможности: пользователь, веб-сайт, время выхода, время входа, время активности, время посещения связанной страницы, время активности, тип активности (корзина, отзывы, оформление заказа, сохранение для последующего использования), предыдущие отзывы пользователя, предыдущая активность пользователя пользователи, рейтинг пользователя, тип пользователя (активный, бездействующий, неактивный), классификация пользователя (активный покупатель, активный браузер, активный рецензент), профиль пользователя.

Мешок слов (Лес продуктов): Создание леса продуктов в соответствии с иерархией.

Поток данных: данные из БД пользователя (1) извлекаются и перемещаются в конвейер данных для очистки и предварительной обработки. После этого формируются пользовательские кластеры (3) в соответствии с поведением данных и шаблонами в данных. Товар stock DB (2) используется для извлечения данных товара и создания иерархической структуры, которая будет использоваться для рекомендации товара, как упомянуто выше. Иерархическая структура называется Продукт Лес (4). После создания кластеров пользователей и кластеров на основе элементов их в сочетании можно использовать для предоставления рекомендаций в реальном времени на основе покупок или поисков пользователя (5). Кроме того, на основе поиска похожих пользователей можно использовать совместный фильтр для генерации рекомендаций. Окончательные результаты (6) будут рассмотрены после того, как товарный запас будет оценен и сгенерирован из Product Forest и отсортирован в порядке сопоставления элементов с результатами совместной фильтрации.