Получение ошибки 405 при попытке загрузить данные nltk

Когда я пробую приведенный ниже код

python -c "import nltk; nltk.download('punkt'); 
nltk.download('averaged_perceptron_tagger'); 
nltk.download('maxent_treebank_pos_tagger'); 
nltk.download('wordnet')"

консоль говорит

[nltk_data] Error loading punkt: HTTP Error 405: Not allowed.
[nltk_data] Error loading averaged_perceptron_tagger: HTTP Error 405:
[nltk_data]     Not allowed.
[nltk_data] Error loading maxent_treebank_pos_tagger: HTTP Error 405:
[nltk_data]     Not allowed.
[nltk_data] Error loading wordnet: HTTP Error 405: Not allowed.

person user2478236    schedule 26.07.2017    source источник
comment
Похоже, сервер загрузки не работает.   -  person Klaus D.    schedule 26.07.2017
comment
Я вижу ту же проблему здесь, так что вы не одиноки.   -  person Kyle Campbell    schedule 26.07.2017
comment
Та же проблема. Я думаю, мы должны подождать.   -  person Julien Salinas    schedule 26.07.2017
comment
Это вызвано устаревшей ссылкой на исходный файл Github. Пожалуйста, подождите, пока мы найдем альтернативу =)   -  person alvas    schedule 26.07.2017
comment
Мы видим это во всей инфраструктуре CI OpenDaylight lists.opendaylight.org/pipermail. /dev/2017-июль/003971.html   -  person dfarrell07    schedule 26.07.2017


Ответы (2)


Это вызвано устаревшей ссылкой на исходный файл Github.

Между тем временным решением будет загрузка файла вручную:

PATH_TO_NLTK_DATA=/home/username/nltk_data/
wget https://github.com/nltk/nltk_data/archive/gh-pages.zip
unzip gh-pages.zip
mv nltk_data-gh-pages/ $PATH_TO_NLTK_DATA

Мы работаем над поиском альтернативы загрузке данных и моделей.

Между тем, @everyone, пожалуйста, помогите проверить ваш скрипт(ы) и убедитесь, что вы не перегружаете загрузку данных! Заранее спасибо!!

Пожалуйста, проверьте https://github.com/nltk/nltk/issues/1787 для последние обновления по этому вопросу.

person alvas    schedule 26.07.2017
comment
github.com/nltk/nltk/issues/1787#issuecomment-318040782 упомянутое здесь решение сработало для меня - person Koen Dercksen; 26.07.2017

Для MacOSX - небольшая модификация приведенного выше ответа:

PATH_TO_NLTK_DATA=~/nltk_data/
wget https://github.com/nltk/nltk_data/archive/gh-pages.zip
unzip gh-pages.zip
mv nltk_data-gh-pages/packages/ $PATH_TO_NLTK_DATA

Обратите внимание, что это большая загрузка (~ 700 МБ).

person Luhar    schedule 27.07.2017