Я новичок в apache solr и работаю над пакетом. Индекс, созданный solr, имеет только файлы .CFS, .gen, insegmentparents и .del.

Я знаю, что он содержит данные заголовка и файла в необработанном формате, но означает ли это, что каждый раз, когда я запрашиваю индекс, необработанные данные обрабатываются, чтобы узнать частоту терминов? Поскольку я не вижу файл .frq? Есть ли способ узнать, как данные хранятся в файле .cfs?


person Gaurav Ranjan    schedule 09.04.2013    source источник


Ответы (1)


Формат файла индекса — Compound. cfs, в котором объединены все файлы.

Проверьте Формат файла, который предоставит подробную информацию о форматах файлов индекса Lucene. .

Вы можете использовать Luke для просмотра файлов индекса Lucene.

person Jayendra    schedule 09.04.2013
comment
Спасибо @jayendra, но у Люка есть поддержка только до lucene codecspostings40 (lucene ver4.0), не более того. Кстати, я попытался открыть его с помощью редактора vim и нашел примерное представление о порядке хранения. - person Gaurav Ranjan; 09.04.2013
comment
еще одна вещь, выполняет ли solr поиск только по строкам, поскольку multimapsolrparams имеет только строку map‹string[]› автоматически вставляет двойные поля, которые я хочу запросить? - person Gaurav Ranjan; 10.04.2013