Я использую Nutch 1.6 и Solr 4.3 на Ubuntu Server 12.04. Я хотел бы включать и выключать индексирование контента. Есть ли способ указать это поведение на моих HTML-страницах, чтобы Solr мог вести себя соответствующим образом?
Например, при использовании Google Search Appliance я бы использовал теги "googleon" - "googleoff" вокруг контента на странице, который я не хочу индексировать (заголовки, нижние колонтитулы, строки авторских прав и т. д.).
благодарю вас