Я использую Elasticsearch для индексации своих документов (хотя я считаю, что мой вопрос может относиться и к любой другой поисковой системе, такой как Lucene или Solr).
Я использую стеммер Портера и список стоп-слов во время индексации. Я знаю, что должен применить тот же парадигматический блок и остановить удаление слов во время поиска, чтобы получить правильные результаты.
Мой вопрос: что, если я решу изменить свой стеммер или добавить/удалить пару слов в/из списка стоп-слов? Должен ли я переиндексировать все документы (или все текстовые поля), чтобы применить изменения? Или есть другой подход к этой ситуации?