введите описание изображения здесь здесь, строка "SEAN", затем она преобразуется в биграммы, каждая биграмма создает разные хэш-значения, но я не понимаю, какая хеш-функция используется здесь и как она генерирует значения int из хеш-значений для отображения в фильтре Блума.
Как сгенерировать хеш-значения из хэш-функции и как получить целые значения из этих хеш-значений?
Ответы (1)
Хэш-функция может быть, например, MurmurHash, на схеме это не указано. Неважно, какой именно используется, если вы всегда используете один и тот же алгоритм при доступе к фильтру Блума.
Как генерировать значения int: например, используя по модулю длину битового массива фильтра Блума. Немного быстрее, как правило, умножение и сдвиг, но это сложнее понять.
person
Thomas Mueller
schedule
12.09.2019