Использование CrawlDbReader для чтения данных сканирования Nutch

Я использую nutch 1.4 для реализации сфокусированного поискового робота. Может ли кто-нибудь сказать мне, как использовать nutch CrawlDbReader, LinkDbReader и SegmentReader API в моей программе JSP, чтобы я мог создавать собственный пользовательский интерфейс для своего проекта. . В частности, мне нужно ввести такие команды, как readdb, readseg и т. д., для данных обхода и получить результат через браузер.

web-crawler nutch

Vijith 09.01.2012 источник

Ответы (1)

arrow_upward
0
arrow_downward

Есть ли что-то особенное в этих API-интерфейсах, что делает это чем-то большим, чем проблема «передачи данных с сервера на клиент»? Вы можете использовать API для получения данных. Просто посмотрите, как они используются nutch.sh, и как строится main(), и сделайте что-то подобное. Затем передайте данные клиенту с помощью XML, JSON или любым другим способом.

AAaa 12.01.2012

comment

Спасибо за ответ. Но однажды я попытался создать объект CrawlDbReader и попытался получить доступ к его методам. Пытался сделать именно то, что делает его функция main(). но некоторые классы из какого-то пакета org.hadoop.xxxx были недоступны из моей программы... есть подсказки??? - Vijith; 13.01.2012

comment

Проверьте свой путь к классам. Вы должны добавить банку hadoop в сборку проекта. Найт точно есть.. - AAaa; 14.01.2012

comment

Я понял .. Фактически, я использовал другой проект eclipse nutch в пути сборки. Теперь я добавил банку Hadoop. Это доступно сейчас. Спасибо.. - Vijith; 16.01.2012

Использование CrawlDbReader для чтения данных сканирования Nutch

Ответы (1)

Похожие вопросы