Вопросы по теме 'minhash'
Связь между (1) хеш-функцией, (2) длиной подписи и (3) сходством Жаккара?
Я пытаюсь понять/реализовать сходство jaccard на основе minHash в python. Основная цель — использовать его в MapReduce. Однако мне не ясно, как выбор хэш-функции и длины подписи влияет на частоту ошибок при вычислении подобия Жаккара. Из википедии...
1021 просмотров
schedule
06.12.2022
Как кластеризовать наборы (пользователей/документов) с распределенным MinHash, используя метод объединения?
У меня есть большие сомнения по поводу того, как мне следует кластеризовать наборы с помощью MinHash вместе с техникой объединения.
Я предполагаю, что все читающие хорошо знакомы с MinHash, поэтому я не буду определять большинство терминов, которые...
291 просмотров
schedule
11.05.2024