Вопросы по теме 'minhash'

Связь между (1) хеш-функцией, (2) длиной подписи и (3) сходством Жаккара?
Я пытаюсь понять/реализовать сходство jaccard на основе minHash в python. Основная цель — использовать его в MapReduce. Однако мне не ясно, как выбор хэш-функции и длины подписи влияет на частоту ошибок при вычислении подобия Жаккара. Из википедии...
1021 просмотров
schedule 06.12.2022

Как кластеризовать наборы (пользователей/документов) с распределенным MinHash, используя метод объединения?
У меня есть большие сомнения по поводу того, как мне следует кластеризовать наборы с помощью MinHash вместе с техникой объединения. Я предполагаю, что все читающие хорошо знакомы с MinHash, поэтому я не буду определять большинство терминов, которые...
291 просмотров