У меня есть имена всех сотрудников моей компании (5000+). Я хочу написать движок, который может на лету находить имена в онлайн-статьях (блогах / вики / справочных документах) и помечать их тегом «mailto» в электронной почте пользователя.
На данный момент я планирую удалить все стоп-слова из статьи, а затем искать каждое слово в люценовом индексе. Но даже в этом случае я вижу много запросов, попадающих в индексы, например, если есть статья с 2000 словами и только двумя ссылками на имена людей, то, скорее всего, будет 1000 запросов lucene.
Есть ли способ уменьшить количество таких запросов? Или совершенно другой способ добиться того же? заранее спасибо