Я новичок в apache solr и работаю над пакетом. Индекс, созданный solr, имеет только файлы .CFS, .gen, insegmentparents и .del.

Я знаю, что он содержит данные заголовка и файла в необработанном формате, но означает ли это, что каждый раз, когда я запрашиваю индекс, необработанные данные обрабатываются, чтобы узнать частоту терминов? Поскольку я не вижу файл .frq? Есть ли способ узнать, как данные хранятся в файле .cfs?

solr lucene solrj

Gaurav Ranjan 09.04.2013 источник

Ответы (1)

arrow_upward
0
arrow_downward

Формат файла индекса — Compound. cfs, в котором объединены все файлы.

Проверьте Формат файла, который предоставит подробную информацию о форматах файлов индекса Lucene. .

Вы можете использовать Luke для просмотра файлов индекса Lucene.

Jayendra 09.04.2013

comment

Спасибо @jayendra, но у Люка есть поддержка только до lucene codecspostings40 (lucene ver4.0), не более того. Кстати, я попытался открыть его с помощью редактора vim и нашел примерное представление о порядке хранения. - Gaurav Ranjan; 09.04.2013

comment

еще одна вещь, выполняет ли solr поиск только по строкам, поскольку multimapsolrparams имеет только строку map‹string[]› автоматически вставляет двойные поля, которые я хочу запросить? - Gaurav Ranjan; 10.04.2013

Я новичок в apache solr и работаю над пакетом. Индекс, созданный solr, имеет только файлы .CFS, .gen, insegmentparents и .del.

Ответы (1)

Похожие вопросы