Я пытаюсь вычислить косинусное сходство между всеми значениями.
Время расчета 1000*20000 стоило мне более 10 минут.
Код:
from gensim import matutils
# array_A contains 1,000 TF-IDF values
# array_B contains 20,000 TF-IDF values
for x in array_A:
for y in array_B:
matutils.cossim(x,y)
Необходимо использовать пакет gensim для получения значения tf-idf и расчета сходства.
Может ли кто-нибудь дать мне несколько советов и указаний, чтобы ускорить время?