Интересно, есть ли какие-то стандарты или передовые методы выполнения инкрементной индексации тройного хранилища для целей семантического поиска.
Действительно, для поддержки семантического поиска обычно используют solr или elasticsearch, где ресурсы индексируются в соответствии с каким-то конкретным запросом SPARQL. Хотя можно переиндексировать весь набор ресурсов, например, раз в день, это нежелательно. Отсюда возникает необходимость выполнять его постепенно. Однако для этого нужно каким-то образом отслеживать изменения, чтобы конечный козел мог продолжать индексировать или удалять только то, что изменилось.
Например, чтобы индексировать только то, что изменилось, запрос SPARQL должен каким-то образом включать какой-то фильтр меток времени.
Если у кого-то есть какие-то предложения или опыт по его выполнению, то он хотел бы поделиться этим, это будет хорошо оценено.
Пока меня несколько вдохновляет подключаемый модуль EEA ElasticSearch RDF River. Я также смотрю на онтологию Changeset Ontology.