Я ищу полнотекстовые индексы SQL Server 2016, и они отлично подходят для поиска нескольких слов, содержащих строки.
Когда я пытаюсь составить полнотекстовый индекс, он показывает Statistical Semantics
в виде флажка. Что делает статистическая семантика?
Более того, я хочу узнать, имели ли вы в виду запросы
Например, допустим, у меня есть запись как house
. Пользователь вводит hause
Могу ли я использовать полнотекстовый индекс, чтобы вернуть hause
как наиболее близкое соответствие и показать пользователю, эффективно ли вы имели в виду дом? Спасибо
Я пробовал soundex, но результаты ужасные
Он возвращает так много несвязанных слов
И поскольку в моей базе данных так много записей, и мне нужны очень быстрые результаты, мне нужно что-то, что SQL-сервер поддерживает изначально.
Любые идеи? Есть ли способ добиться этого с помощью индексов?
Я знаю, что существует несколько алгоритмов, но они недостаточно эффективны для использования в Интернете. Я имею в виду, как вычислить расстояние редактирования между каждой записью. Их можно было бы использовать для оффлайн-проектов, но мне нужна эта эффективность в онлайн-словаре, где постоянно будут тысячи запросов.
У меня уже есть план в голове. Сохранение ненайденных результатов в базе данных и автономный расчет ближайших совпадений. И используя их как кеш. Однако мне интересно, может ли существовать какое-либо возможное онлайн-решение? Учтите, что будет более 100 миллионов записей nvarchar