Получение только 100 проблем со сканированием с помощью инструмента для веб-мастеров

Я использую Feed CrawlIssues = wtr.GetCrawlIssues(encodedSiteID); чтобы получить ошибки сканирования из моей учетной записи инструмента для веб-мастеров. Существует более 5 тысяч ошибок, но приведенный выше код извлекает только первые 100. Как мне получить все ошибки?

Спасибо


person Mithil    schedule 15.02.2013    source источник


Ответы (1)


Я столкнулся с той же проблемой, что и вы, я тоже получил только первые 100 ошибок. По сути, из-за ошибки в инструментах для веб-мастеров он показывает вам ошибки только в 100 пакетах.

Насколько я знаю, у него нет встроенного решения, но есть обходной путь. Вместо использования функции GetCrawlIssues вы можете получить доступ к данным через HTTP-запросы с помощью предоставленного инструмента командной строки ExecRequest.exe. Основное использование:

ExecRequest cl QUERY http://www.google.com/webmasters/tools/feeds/example_site.com/crawlissues/?start-index=1&max-results=100 [email protected] мой пароль

Это выведет результирующий XML на консоль. Вы можете указать начальную точку и количество ошибок, которые вы хотите загрузить:
?start-index=startIndex
&max-results=100
Вы можете установить любое значение максимального результата, но он будет загружать максимум 100 элементов.
После пакетной загрузки вы можете получить данные из загруженных xml-файлов.

Если вам нужны только данные, я также написал небольшой скрипт на Python, вы можете проверить его здесь это довольно просто.

person fulibacsi    schedule 12.12.2013
comment
Добро пожаловать в Stack Overflow! Отличный первый ответ, продолжайте в том же духе! - person Danny Beckett; 12.12.2013