Solr и пользовательский обработчик обновлений

У меня есть вопрос о Solr и возможности реализовать собственный обработчик обновлений.

В общем, сценарий такой:

  • FIELD-A: мое основное поле
  • FIELD-B и FIELD-C: 2 копируемых поля с источником в A

После того, как FIELD-A сохранил свое значение, мне нужно, чтобы это значение было скопировано в FIELD-B и C, затем обработано (скажем, извлечено подстроку) и сохранено в FIELD-B и C до времени индексации. Я не использую ДХИ.

изменить: я отправляю свои данные через nutch (забыл упомянуть об этом)

Насколько я понял, copyfields срабатывает после индексации (но я не уверен в этом).

Я уже прочитал страницу вики и до сих пор многого не понимаю:

1) customupdateprocessor является альтернативой условному копифилду или они должны существовать оба в моем solr?

2) после создания файла jar условного поля копирования, как мне объявить его в моей схеме?

3) как мне изменить файл solrconfig.xml, чтобы использовать программу обновления?

4) если я выбираю неправильный путь, любое предложение приветствуется, лучше, если будут предоставлены некоторые примеры или хорошо документированные ссылки.

Я много читал (гуглил и lucene ml на nabble), но документации по этому поводу не так много. Мне просто нужно создать собственное средство обновления для двух моих полей копирования,

Спасибо всем заранее!


person Samuele Mattiuzzo    schedule 06.07.2011    source источник
comment
Я только что разговаривал по irc с одним из разработчиков solr, и он помог мне разобраться. вики-страница (как он также сказал) слабая, поэтому, когда я закончу, я добавлю ее более новую версию. как только он будет закончен, я снова опубликую здесь с объяснением и новым руководством по вики, чтобы каждый, у кого есть моя проблема, мог выбрать правильный путь!   -  person Samuele Mattiuzzo    schedule 06.07.2011


Ответы (2)


На самом деле это не сложно. Ниже приведена отличная ссылка, по которой я наткнулся, чтобы написать собственный обработчик обновлений solr.

  http://knackforge.com/blog/selvam/integrating-solr-and-mahout-classifier

Я проверил это в своем solr, и он просто отлично работает!

person Karthick    schedule 30.03.2012
comment
Благодарить! На самом деле мне удалось решить проблему в конце прошлого года, но на самом деле мне нужен был алгоритм категоризации! Кроме того, это действительно хороший практический пример пользовательского обработчика обновлений! Это ответ 2 в 1! Слава дружище! - person Samuele Mattiuzzo; 30.03.2012

Если вы используете SOLR 4 или планируете его использовать, http://wiki.apache.org/solr/ScriptUpdateProcessor может быть более простым решением. Радоваться, веселиться!

person Karthick    schedule 20.09.2012