Поисковая система для веб-приложений - многоязычная и многобазовая

Я работаю над проектом веб-сайта. У нас есть база MySql и MongoDb.

  • Мы хотим добавить полнотекстовый поисковик по этим базам (и лучше, если его можно слинковать с PostgreSql).

  • Эти базы данных содержат многоязычные тексты, но мы не можем определить язык.

Я видел Solr, ElasticSearch и Sphinx, но что вы можете посоветовать на эту тему?

  • Solr и Sphinx имеют основы, но я не уверен, что мы можем использовать их, не зная языка контента...

  • Elastic — это полный JSON, который мог бы быть лучше, если бы мы использовали все больше и больше mongoDb...


person Aurélien B    schedule 01.10.2010    source источник


Ответы (2)


Неважно, какой поисковой системой вы пользуетесь, поиск корней сильно зависит от языка. ИМХО, вам придется каким-то образом определить язык, чтобы передать текст правильному стеммеру.

person Mauricio Scheffer    schedule 01.10.2010

Существует продукт от Basis Technologies под названием Rosette Language Platform, который автоматически определяет языки, на которые вы можете обратить внимание.

Solr поддерживает JSON для результатов (и индексацию???), если это ключевой механизм интеграции. Я бы поместил поддержку «JSON» немного дальше в списке вещей, по которым нужно использовать систему показателей, и сосредоточился бы на том, насколько релевантными будут результаты из поисковой системы X для моего домена.

person Eric Pugh    schedule 01.10.2010