Использование CrawlDbReader для чтения данных сканирования Nutch

Я использую nutch 1.4 для реализации сфокусированного поискового робота. Может ли кто-нибудь сказать мне, как использовать nutch CrawlDbReader, LinkDbReader и SegmentReader API в моей программе JSP, чтобы я мог создавать собственный пользовательский интерфейс для своего проекта. . В частности, мне нужно ввести такие команды, как readdb, readseg и т. д., для данных обхода и получить результат через браузер.


person Vijith    schedule 09.01.2012    source источник


Ответы (1)


Есть ли что-то особенное в этих API-интерфейсах, что делает это чем-то большим, чем проблема «передачи данных с сервера на клиент»? Вы можете использовать API для получения данных. Просто посмотрите, как они используются nutch.sh, и как строится main(), и сделайте что-то подобное. Затем передайте данные клиенту с помощью XML, JSON или любым другим способом.

person AAaa    schedule 12.01.2012
comment
Спасибо за ответ. Но однажды я попытался создать объект CrawlDbReader и попытался получить доступ к его методам. Пытался сделать именно то, что делает его функция main(). но некоторые классы из какого-то пакета org.hadoop.xxxx были недоступны из моей программы... есть подсказки??? - person Vijith; 13.01.2012
comment
Проверьте свой путь к классам. Вы должны добавить банку hadoop в сборку проекта. Найт точно есть.. - person AAaa; 14.01.2012
comment
Я понял .. Фактически, я использовал другой проект eclipse nutch в пути сборки. Теперь я добавил банку Hadoop. Это доступно сейчас. Спасибо.. - person Vijith; 16.01.2012