Мне нужно отфильтровать поток текстовых статей, проверяя каждую запись на наличие нечетких совпадений с предопределенной строкой (я ищу названия продуктов с ошибками, иногда они имеют другой порядок слов и дополнительные небуквенные символы, такие как «:» или «,»).
Я получаю отличные результаты, помещая эти статьи в индекс сфинкса и выполняя поиск по нему, но, к сожалению, я получаю сотни статей каждую секунду, и обновление индекса после получения каждой статьи происходит слишком медленно (и я понимаю, что он не предназначен для такой задачи). Мне нужна библиотека, которая может создавать индекс памяти небольшого текста размером ~ 100 КБ и выполнять нечеткий поиск по нему, существует ли что-нибудь подобное?