Публикации по теме 'bloom-filter'


Реализация фильтра Блума Fast AF
Фильтры Блума — это вероятностная структура данных, позволяющая быстро проверять принадлежность элементов к набору. Они обычно используются для уменьшения объема памяти, необходимого для хранения большого набора элементов, а также для повышения скорости проверки членства. В этом уроке мы узнаем, как реализовать фильтр Блума в Swift и поймем, как он работает. Выполнение Чтобы реализовать фильтр Блума в Swift, мы начнем с создания структуры, представляющей сам фильтр. Эта структура будет..

Вопросы по теме 'bloom-filter'

Достаточно ли независимы перекрывающиеся подмассивы массива байтов, чтобы их можно было использовать в качестве хеш-функций для фильтра Блума?
У меня следующий вопрос в контексте BloomFilter. BloomFilters должны иметь k независимых хеш-функций. Назовем эту функцию h1, h2, ... hk . Независимость в этом контексте означает, что их значение будет иметь очень небольшую корреляцию (надеюсь,...
171 просмотров
schedule 06.05.2024

Существует ли реализация частного фильтра с открытым исходным кодом?
См. http://en.wikipedia.org/wiki/Quotient_filter . Я еще не нашел ни одной реализации, и я хотел бы с чем-то поиграть, объяснение в Википедии, на мой вкус, немного суховато.
1278 просмотров
schedule 05.11.2023

какие есть варианты получения k попарно независимых хеш-функций, которые являются быстрыми
Я столкнулся с потребностью в k попарно независимых хеш-функциях, каждая из которых принимает в качестве входных данных целое число и выдает хэш-значение в диапазоне от 0 до N. Это нужно для скетча count-min, похожего на фильтр Блума. Формально...
576 просмотров
schedule 08.02.2023

Как использовать результат хэш-функции для получения индекса массива?
Я изучаю фильтры Блума и просматриваю различные хеш-функции в JavaScript. Например, я нашел это в другом ответе на переполнение стека: Найдено здесь https://stackoverflow.com/a/7616484/5217568 ) String.prototype.hashCode = function() {...
1390 просмотров

Является ли это эффективным / подходящим использованием фильтра Блума?
У меня есть API, из которого приходят данные, но многие из них избыточны (можно определить по идентификатору). У меня есть фильтр Блума, созданный с несколькими миллионами записей для начала. Я использую эту библиотеку для обработки реализации....
78 просмотров
schedule 27.12.2022

Кассандра. Размер фильтра Блума › 16 ГБ, уменьшите bloom_filter_fp_chance
После восстановления данных в кластере Cassandra (1 узел) у меня ошибка: ERROR [CompactionExecutor:7] 2016-05-09 08:05:38,621 CassandraDaemon.java:185 - Exception in thread Thread[CompactionExecutor:7,1,main]...
715 просмотров
schedule 28.02.2022

Выбор хеш-функций, используемых фильтрами Guava Bloom
При создании фильтра Блума с библиотекой Guava ожидается, что вы укажете воронку и ожидаемое количество вставок (и, возможно, желаемый процент ложных срабатываний). Есть ли способ установить, какие хэш-функции должен использовать фильтр Блума? Если...
760 просмотров
schedule 08.04.2024

Является ли Bloomfilter односторонним хешем?
Я планирую распространять через S3 блумфильтр для одного из клиентских приложений. Есть несколько вариантов, которые я могу взять здесь. Разрешить клиенту загружать файл напрямую с S3 через предварительно подписанный URL-адрес. Отправьте...
38 просмотров
schedule 20.10.2022

Подсчитайте уникальных пользователей, если пользователь посещает n раз
Я хочу реализовать FreqCapping в рекламной сети. Я хочу обслуживать кампанию для уникальных пользователей только n раз в день. Если n=1, я мог бы реализовать это с помощью BloomFilter в Redis, но обычно n больше 1. Существует ли какая-либо структура...
366 просмотров
schedule 03.12.2022

Как сгенерировать хеш-значения из хэш-функции и как получить целые значения из этих хеш-значений?
введите описание изображения здесь здесь, строка "SEAN", затем она преобразуется в биграммы, каждая биграмма создает разные хэш-значения, но я не понимаю, какая хеш-функция используется здесь и как она генерирует значения int из хеш-значений для...
39 просмотров

Алгоритм расстановки переносов с использованием фильтра Блума
Классический пример яркости фильтров Блума - в алгоритмах расстановки переносов . Это даже пример, приведенный в исходной статье о фильтрах Блума . Я не понимаю, как фильтр Блума будет использоваться в алгоритме расстановки переносов....
100 просмотров
schedule 10.03.2023

guava - bloomfilter: возможно ли получить истинно-отрицательное значение для значения, которое ** ранее ** было ложноположительным?
Если я правильно понимаю, когда элемент put внутри фильтра цветения гуавы, mightContain всегда будет возвращать истину. Если фильтр возвращает false на mightContain , значит, значение никогда не помещалось в фильтр. Что мне интересно, так это...
61 просмотров
schedule 18.12.2023

Можно ли конвейеризировать команды фильтра Блума Redis?
В Redis есть модуль для работы с фильтрами Блума: https://oss.redislabs.com/redisbloom/Bloom_Commands/ Redis также позволяет выполнять конвейерную обработку команд: https://redis.io/topics/pipelining В частности, я хочу проверить наличие...
144 просмотров
schedule 28.12.2022