Исключено: роботы без индекса

Я настроил веб-URL для сканирования данных веб-контента. Все веб-данные успешно сканируются в моем GSA, но я получаю сообщение «Исключено: роботы не индексируются» в диагностике индекса для одного URL-адреса, и документ с этого URL-адреса не индексируется в GSA.

документ не содержит метатегов [META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"].

вы наблюдали такое поведение в GSA?


person A Rathod    schedule 16.01.2017    source источник


Ответы (3)


Проверьте содержимое соответствующего robots.txt, там будет правило, если его нет на реальной странице в виде метаданных.

person BigMikeW    schedule 17.01.2017
comment
Я проверил файл robot.txt и не нашел никакого правила для запрета шаблона URL-адреса для этого URL-адреса .... также нет правила на странице. - person A Rathod; 18.01.2017
comment
Продолжайте искать, у вас где-то определено правило, и GSA просто соблюдает его. - person BigMikeW; 25.01.2017

Установите флажок «Начальные и заблокированные URL-адреса»> «Не следовать шаблонам» в конфигурации GSA. Возможно, там это было исключено.

person Sandeep    schedule 09.02.2017

У меня тоже была эта проблема. Сначала я проверил, что мой URL-адрес не исключается из индексации, с помощью онлайн-тестеров robots.txt. Затем я проверил свою ссылку в разделе «Начальные и заблокированные URL-адреса» в GSA, чтобы убедиться, что она не соответствует никаким фильтрам блокировки.

Как только эти возможности были устранены, я перешел в «Индекс» -> «Диагностика» -> «Диагностика индекса» и выбрал подходящую коллекцию. Оттуда, как только я перешел к имени файла и щелкнул его, появляется экран с кнопкой «Повторно просканировать этот URL». Нажатие этой кнопки решило проблему для меня.

person Allen    schedule 09.09.2017