Запуск Apache Nutch в Windows

Я пытаюсь запустить Apache Nutch в Windows для сканирования веб-страниц. Я установил cygwin и установил его путь. Но я получаю следующее исключение:

Exception in thread "main" java.io.IOException: Failed to set permissions of path:    \tmp\hadoop-cjindal\mapred\staging\cjindal-330065706\.staging to 0700
at org.apache.hadoop.fs.FileUtil.checkReturnValue(FileUtil.java:682)
at org.apache.hadoop.fs.FileUtil.setPermission(FileUtil.java:655)
at org.apache.hadoop.fs.RawLocalFileSystem.setPermission(RawLocalFileSystem.java:509)
at org.apache.hadoop.fs.RawLocalFileSystem.mkdirs(RawLocalFileSystem.java:344)
at org.apache.hadoop.fs.FilterFileSystem.mkdirs(FilterFileSystem.java:189)
at org.apache.hadoop.mapreduce.JobSubmissionFiles.getStagingDir(JobSubmissionFiles.java:116)
at org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:856)
at org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:850)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:396)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1083)
at org.apache.hadoop.mapred.JobClient.submitJobInternal(JobClient.java:850)
at org.apache.hadoop.mapred.JobClient.submitJob(JobClient.java:824)
at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1261)
at org.apache.nutch.crawl.Injector.inject(Injector.java:217)
at org.apache.nutch.crawl.Crawl.run(Crawl.java:127)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.nutch.crawl.Crawl.main(Crawl.java:55)

Я не устанавливал хауп. Пожалуйста помоги.


person user1463504    schedule 18.06.2012    source источник
comment
Nutch работает на Hadoop, а у Hadoop есть проблемы с запуском в Windows для установки разрешений для папок и других частей. Проверьте любой вариант Unix, и ваша жизнь станет проще.   -  person Jayendra    schedule 18.06.2012


Ответы (1)


Nutch лучше запускать на Unix. Но если вы хотите запустить его в Windows, то, вероятно, вы можете загрузить версию Nutch 1.2, которая поставляется с версией Hadoop, в которой нет этой проблемы.

person CRS    schedule 19.06.2012