Как найти близкие совпадения в одном столбце с помощью Rails и Active Record?

Я знаю способы найти точные повторяющиеся записи в одной таблице с помощью базового SQL и языка запросов активных записей. Но мне нужно знать, как реализовать поиск по точному совпадению, хотелось бы учесть орфографические ошибки. Как лучше всего найти потенциальные дубликаты и близкие совпадения в приложении rails? Я использую MySQL в качестве базы данных.

Изменить: тип данных, которые я хотел бы сопоставить, - это строки, они хранятся в базе данных как строки.


person OpenCoderX    schedule 21.12.2012    source источник
comment
что такое близкое совпадение? на основе строки?   -  person John Naegle    schedule 21.12.2012
comment
Да струнный. Я не уверен в доступных методах или с чего начать.   -  person OpenCoderX    schedule 21.12.2012


Ответы (1)


Я думаю, что Think_sphinx и Sphinx может быть для вас двумя интересными инструментами. То, что вам нужно, обеспечивается набором функций, называемых полнотекстовым поиском, который является большой темой, которую нужно объяснить в одном ответе, но вы, вероятно, захотите узнать о «близости слов» и «лексемах».

person systho    schedule 21.12.2012