Как вывести причину сходства в Gremlin

У меня есть следующий простой график:

Пользователь - Нравится -> Товар

Я нахожу 10 лучших пользователей, похожих на пользователя u, используя следующий код Gremlin:

u.out('Likes').in('Likes').filter([u]).groupCount.cap.orderMap(T.decr)[0..10].map()

Это выводит что-то вроде этого:

==>{userid=1}
==>{userid=5}
==>{userid=10}
==>{userid=15}

Я хотел бы, чтобы вывод был более информативным и имел дополнительную информацию, такую ​​как рейтинг на отсортированной карте и элементы (itemid), общие с исходным пользователем, примерно так:

==>{userid=1, rank=0, reason_items={1,2,3,5}}
==>{userid=5, rank=1, reason_items={1,2,10}}
==>{userid=10, rank=2, reason_items={1,2,4}}
==>{userid=15, rank=3, reason_items={1,2}}

Было бы неплохо создать эффективный пример кода gremlin-groovy!

Спасибо.


person jack12345    schedule 05.03.2015    source источник


Ответы (2)


Добавив соответствующее закрытие transform к вашему запросу:

rank = 0; itemsU1 = [] as Set; u1.out('Likes').aggregate(itemsU1).in('Likes')
      .filter{it != u1}.groupCount.cap.orderMap(T.decr)
      .transform{[id:it.id, rank:rank++, reason_item_ids:itemsU1.intersect(it.out('Likes').toSet()).collect{it.id}]}

… Вы можете получить:

==>{id=User6, rank=0, reason_item_ids=[Item1, Item5]}
==>{id=User4, rank=1, reason_item_ids=[Item1, Item2]}
==>{id=User2, rank=2, reason_item_ids=[Item1]}
==>{id=User5, rank=3, reason_item_ids=[Item5]}
==>{id=User3, rank=4, reason_item_ids=[Item2]}

для следующего примера графика:

g = new TinkerGraph()

u1 = g.addVertex('User1')
u2 = g.addVertex('User2')
u3 = g.addVertex('User3')
u4 = g.addVertex('User4')
u5 = g.addVertex('User5')
u6 = g.addVertex('User6')

i1 = g.addVertex('Item1')
i2 = g.addVertex('Item2')
i3 = g.addVertex('Item3')
i4 = g.addVertex('Item4')
i5 = g.addVertex('Item5')

g.addEdge(u1,i1,'Likes')
g.addEdge(u1,i2,'Likes')
g.addEdge(u1,i5,'Likes')
g.addEdge(u2,i1,'Likes')
g.addEdge(u2,i4,'Likes')
g.addEdge(u3,i2,'Likes')
g.addEdge(u4,i1,'Likes')
g.addEdge(u4,i2,'Likes')
g.addEdge(u4,i3,'Likes')
g.addEdge(u5,i4,'Likes')
g.addEdge(u5,i5,'Likes')
g.addEdge(u6,i1,'Likes')
g.addEdge(u6,i4,'Likes')
g.addEdge(u6,i5,'Likes')
person Faber    schedule 05.03.2015

Учитывая образец графика Фабера, вы можете сделать это:

u = u1; m = [:].withDefault {[]}; rank = 0; key = null
u.out('Likes').as('item').in('Likes').except([u]).as('user').select().groupBy {
  key = it.getColumn('user')
} {
  m[key] << it.getColumn('item').id
} {
  it.size()
}.cap().orderMap(T.decr)[0..10].transform {[
  'userid'         : it.id,
  'rank'           : rank++,
  'reason_item_ids': m[it]
]}

Нет необходимости во вложенных обходах внутри .transform().

person Daniel Kuppitz    schedule 05.03.2015