Solr: получить несохраненные поля из внешнего источника данных

В настоящее время я работаю над проектом, в котором я хотел бы проиндексировать несколько источников данных (Oracle и HBase) в Solr для полнотекстового поиска. Кроме того, я хочу иметь возможность визуализировать данные, которые я индексирую в Solr. Я все еще раздумываю, использовать ли для этого Banana или Hue.

Здесь возникает проблема: насколько я понял документы Solr, я могу выполнять поиск только по проиндексированным, но не сохраненным полям, но не могу получить их исходное содержимое. Я полагаю, что визуализаторам будет довольно сложно создавать для меня красивые, помеченные графики;)

Я действительно хотел бы избежать хранения полей, поскольку фактические данные могут в конечном итоге стать довольно большими, и они уже хранятся в другой базе данных. Есть ли какой-то плагин (может быть, еще один SearchHandler?), который может извлекать совпадающие поля данных из внешнего источника данных, чтобы иметь возможность доставлять их вместе с результатами поиска? Если нет, то где лучше всего реализовать такой функционал? Solr SearchHandler? Банан/Оттенок?

Заранее большое спасибо за любые предложения! :)


person Marco H.    schedule 01.06.2015    source источник


Ответы (1)


ИМХО, лучший способ реализовать такую ​​​​функциональность - это SearchHandler, который возвращает «совместимый» ответ Banana. Вы должны индексировать поля, которые вам нужны для поиска, не сохраняя их в Solr. Обработчик поиска должен получить соответствующие строки из HBase в соответствии с результатами поиска, что позволит пометить данные в Banana. В отдельном процессе вы также должны периодически поддерживать индекс, когда данные HBase добавляются, обновляются и т. д. Первый вариант использования здесь очень похоже на ваше.

person aadel    schedule 04.06.2015
comment
Именно этого я и опасался ;) Большое спасибо за ответ! - person Marco H.; 10.06.2015