nutch-default.xml предполагает, что есть способ сохранить место назначения перенаправления при первом обходе и обходить его при следующем обходе, установив для http.redirect.max
значение 0.
Первое сканирование завершилось успешно, и мы могли видеть ответ перенаправления в сохраненных сегментах. Затем мы попытались обновить базу данных обхода, чтобы добавить пункт назначения перенаправления в следующий список выборки, но мы не смогли включить их — список выборки казался в основном пустым, всего несколько URL-адресов, которые nutch не удалось просканировать на первое сканирование.
Есть ли параметр/конфигурация, которые нам нужно указать во время синтаксического анализа/обновления/генерации?