Я пытаюсь найти косинусное сходство двух документов, представленных следующим образом:
d1: [(0,1), (3,2), (6, 1)]
d2: [(1,1), (3,1), (5,4), (6,2)]
где каждый документ представляет собой вектор веса темы, где темы — это первый элемент в кортеже, а вес — второй элемент.
Я не уверен, как в этом случае вычислить косинусное сходство с этой взвешенной схемой? Есть ли какой-нибудь модуль/пакет в Python, который позволил бы мне сделать это?