Эта статья является частью серии Academic Alibaba и взята из статьи Цзэминь Лю, Винсента В. Чжэна, Чжоу Интерактивное встраивание путей для поиска семантической близости в гетерогенных графах Чжао, Чжао Ли, Хунся Ян и Минхуэй У, приняты KDD 2018. Полную версию статьи можно прочитать здесь.
Одна из самых привлекательных особенностей веб-платформ - это возможность пользователей общаться с другими. Например, в социальных сетях пользователю, возможно, даже не придется активно искать друзей, прежде чем платформа порекомендует новые связи. Под поверхностью этих веб-платформ лежит обширная сеть соединений между пользователями, и большая часть этой сети полагается на «поиск семантической близости»: использование объекта в сети в качестве запроса и ранжирование других объектов в соответствии с семантическими отношениями.
Поиск семантической близости смотрит на такие характеристики, как местоположение, место работы и школа, чтобы определить семантические отношения, подразумеваемые этими связями. Оттуда поиск берет пользователя в качестве запроса и спрашивает, какие другие пользователи могут быть соседями, коллегами или одноклассниками, соответственно ранжируя их. Эти рейтинги затем используются для поддержки таких функций, как рекомендуемые связи в социальных сетях, связи консультантов / консультантов в библиографических сетях и связывание идентификаторов пользователей на платформах электронной коммерции.

Однако поиск семантической близости не идеален. Семантические отношения в разнородных списках не всегда являются явными, и между объектами могут отсутствовать связи.
Предыдущие исследования семантической близости пытались измерить семантическую близость с помощью путей, соединяющих объект запроса и целевой объект. Однако эти пути слабо связаны при моделировании, и каждый путь обрабатывается индивидуально. Их результаты агрегируются только на заключительном этапе, что ограничивает способность модели формировать полную картину взаимозависимости между объектами.
Техническая команда Alibaba в сотрудничестве с исследователями из Чжэцзянского университета и Центра передовых цифровых наук в Сингапуре разработала интерактивное встраивание путей (IPE) для более сильного связывания путей для семантического поиска близости, поиска связей между пользователями, которые могут остаться незамеченными при текущих базовых показателях.
Разработка IPE
Команда исследователей Alibaba представила концепцию интерактивных путей, одновременно обрабатывая несколько путей и добавляя зависимости между ними. В результате эти пути считаются сильно связанными. Затем эти интерактивные пути встраиваются в вектор низкой размерности, который может охватить весь объем семантических отношений между пользователями.

Оттуда исследователи использовали безцикловый механизм перетасовки. Циклы в структуре графа нежелательны, потому что они затрудняют доступ двух узлов друг к другу. Этот механизм меняет порядок путей, чтобы удалить разные циклы и максимизировать эффективность пути. Затем архитектура Gated Recurrent Unit (GRU) включает интерактивные пути и позволяет каждому ГРУ моделировать взаимозависимости от других ГРУ. Наконец, выходные данные внедрения структуры интерактивных путей агрегируются как один вектор, который затем может использоваться для оценки близости семантических отношений.
Применение IPE на практике
Чтобы проверить эффективность IPE на местах, техническая группа Alibaba искала различные типы гетерогенных сетей, такие как LinkedIn, Facebook, DBLP и Taobao. В ходе эксперимента перед IPE и несколькими другими базовыми планами семантического поиска пользователей была поставлена задача определить различные типы отношений на основе наборов характеристик, уникальных для каждой сети. Исследователи построили идеальный рейтинг для каждого пользователя тестового запроса и каждого желаемого семантического отношения. Они сравнили этот идеальный рейтинг с рейтингом, созданным различными современными алгоритмами семантического поиска пользователей.
Во всех этих тестах IPE превзошел не только конкурирующие базовые показатели, но и ухудшенные версии самого себя, часто со значительным отрывом. Это подтверждает структуру интерактивных путей и открывает двери для расширения IPE для обработки атрибутов и динамики в гетерогенных сетях для поиска семантической близости.

Полную версию статьи можно прочитать здесь.
Alibaba Tech
Подробная информация о последних технологиях Alibaba из первых рук → Facebook: Alibaba Tech. Twitter: « AlibabaTech ».