Я знаю, что он содержит данные заголовка и файла в необработанном формате, но означает ли это, что каждый раз, когда я запрашиваю индекс, необработанные данные обрабатываются, чтобы узнать частоту терминов? Поскольку я не вижу файл .frq? Есть ли способ узнать, как данные хранятся в файле .cfs?
Я новичок в apache solr и работаю над пакетом. Индекс, созданный solr, имеет только файлы .CFS, .gen, insegmentparents и .del.
Ответы (1)
Формат файла индекса — Compound. cfs, в котором объединены все файлы.
Проверьте Формат файла, который предоставит подробную информацию о форматах файлов индекса Lucene. .
Вы можете использовать Luke для просмотра файлов индекса Lucene.
person
Jayendra
schedule
09.04.2013
Спасибо @jayendra, но у Люка есть поддержка только до lucene codecspostings40 (lucene ver4.0), не более того. Кстати, я попытался открыть его с помощью редактора vim и нашел примерное представление о порядке хранения.
- person Gaurav Ranjan; 09.04.2013
еще одна вещь, выполняет ли solr поиск только по строкам, поскольку multimapsolrparams имеет только строку map‹string[]› автоматически вставляет двойные поля, которые я хочу запросить?
- person Gaurav Ranjan; 10.04.2013