У меня есть база данных из ~ 150 000 слов и шаблон (любое отдельное слово), и я хочу получить все слова из базы данных, у которой расстояние Дамерау-Левенштейна между ним и шаблоном меньше заданного числа . Мне нужно сделать это очень быстро. Какой алгоритм вы могли бы предложить? Если нет хорошего алгоритма определения расстояния Дамерау-Левенштейна, то можно будет приветствовать и расстояние Левенштейна.
Спасибо за помощь.
P.S. Я не собираюсь использовать SOUNDEX.