Обрабатывают ли поисковые системы Javascript?

Согласно этой странице, похоже, что они этого не делают, в том смысле, что они фактически не запускают его, но этой странице 2 года (судя по информации об авторских правах).

Причина, по которой я задаю этот вопрос, заключается в том, что мы используем Javascript для замены текста на нашем сайте другим, более типографически правильным контентом. Мы обеспокоены тем, что это может повлиять на возможность сканирования / поискового поиска наших сайтов, поскольку обычно мы заменяем заголовки; т.е. <h1>, <h2> и т. Д.

Увидят ли боты поисковых систем наш исходный код или они запустят Javascript и увидят замененный текст?


person Matthew Scharley    schedule 15.01.2010    source источник


Ответы (6)


Google теперь официально обрабатывает JavaScript.

Чтобы решить эту проблему, мы решили попытаться понять страницы с помощью JavaScript. Это сложно сделать в нынешних масштабах Интернета, но мы решили, что оно того стоит. В течение некоторого времени мы постепенно улучшали то, как мы это делаем. В последние несколько месяцев наша система индексирования отображала значительное количество веб-страниц, больше напоминающих браузер обычного пользователя с включенным JavaScript.

  • Иногда во время рендеринга что-то идет не так, что может негативно повлиять на результаты поиска по вашему сайту. Вот несколько потенциальных проблем и, где это возможно, как вы можете помочь предотвратить их возникновение:
  • Если такие ресурсы, как JavaScript или CSS в отдельных файлах, заблокированы (например, с помощью robots.txt) и робот Googlebot не может их получить, наши системы индексации не смогут увидеть ваш сайт как обычный пользователь. Мы рекомендуем разрешить роботу Googlebot получать JavaScript и CSS, чтобы ваш контент мог быть лучше проиндексирован. Это особенно важно для мобильных веб-сайтов, где внешние ресурсы, такие как CSS и JavaScript, помогают нашим алгоритмам понять, что страницы оптимизированы для мобильных устройств. Если ваш веб-сервер не может обрабатывать объем запросов на сканирование ресурсов, это может отрицательно сказаться на нашей способности отображать ваши страницы. Если вы хотите убедиться, что ваши страницы могут отображаться в Google, убедитесь, что ваши серверы могут обрабатывать запросы на сканирование ресурсов.
  • Это всегда хорошая идея, чтобы ваш сайт постепенно деградировал. Это поможет пользователям получать удовольствие от вашего контента, даже если в их браузерах нет совместимых реализаций JavaScript. Это также поможет посетителям с отключенным или отключенным JavaScript, а также поисковым системам, которые еще не могут выполнять JavaScript.
  • Иногда JavaScript может быть слишком сложным или непонятным для выполнения, и в этом случае мы не можем полностью и точно отобразить страницу.
  • Некоторый JavaScript удаляет контент со страницы, а не добавляет, что не позволяет нам индексировать контент.
person John Conde    schedule 11.10.2015

Поисковые системы не обрабатывают JavaScript как таковой.

Есть некоторые доказательства что в некоторых случаях Google мог начать обработку содержимого встроенного скрипта, чтобы перехватить содержимое, которое вводится в очередь синтаксического анализа страницы с помощью document.write. Однако, конечно, методы DOM, такие как вы могли бы использовать для замены шрифтов, не затрагиваются, и код загрузки не вызывается.

person bobince    schedule 15.01.2010

Вообще-то нет. Google упомянул, что они работают над системой индексации контента ajax, но я не думаю, что какие-либо из основных поисковых систем, как правило, индексируют динамический контент. См. Эту страницу, чтобы узнать о том, что делает Google: http://www.google.com/support/webmasters/bin/answer.py?hl=ru&answer=81766

person Glenn Slaven    schedule 15.01.2010

Боты, конечно, не будут запускать код Javascript, но они могут распознавать некоторые часто используемые сценарии.

Но рассчитывать на это не стоит. Четкая разметка, правильный контент и реальные ссылки по-прежнему важны.

Кроме того, если боты узнают ваш скрипт, это может быть не в вашу пользу. Если код распознается как что-то, что обычно используется для обмана ботов, это может даже повлиять на рейтинг вашей страницы.

person Guffa    schedule 15.01.2010

Я бы использовал метаданные, чтобы роботы подбирали контент с ваших страниц.

person calico-cat    schedule 15.01.2010
comment
Достаточно хорошо установлено, что метаданные явно игнорируются всеми поисковыми системами. - person Breton; 15.01.2010
comment
Не совсем правильно. Я считаю, что Google, например, будет использовать метатег «description», если он доступен в качестве отображаемого отрывка. Это тоже могло быть ошибкой, но я слышал об этом. - person Matthew Scharley; 15.01.2010
comment
Текст под результатами поиска Google показывает ваш поисковый запрос в контексте или описание метаданных (если в его алгоритме используется текст ссылки) - person calico-cat; 15.01.2010
comment
Метаданные действительно игнорируются, потому что они могут обмануть ботов относительно фактического контента. Только description может быть проиндексирован (это делает Google), и он будет отображаться как описание сайта в результатах поиска (однако он не будет проиндексирован как ключевые слова). - person BalusC; 15.01.2010
comment
В некоторых случаях он будет использовать описание, но я не думаю, что он использует этот текст для индексации ключевых слов. - person Glenn Slaven; 15.01.2010

Я знаю, что общее мнение таково, что Google не обрабатывает javascript и не индексирует что-либо с тегом <script>, однако общий консенсус кажется неверным.

Попробуйте поискать следующее с окружающими кавычками (или нажмите здесь):

"Samsung Public Interest Statement by Thomas Fusco, Fish & Richardson P.C., for Samsung."

У вас должен быть только один результат. Теперь нажмите на этот результат (или просто нажмите здесь) и просмотрите источник.

Нажмите CTRL-F для текста, который вы искали в Google. Обратите внимание, что текст находится в переменной javascript, а не в html. Google должен обрабатывать некоторый javascript, чтобы включить эти слова в свой индекс.

person speedplane    schedule 28.04.2014
comment
Как отмечено в принятом ответе, есть свидетельства того, что Google обрабатывает встроенные скрипты (именно то, что находится на связанной странице), чтобы попытаться получить динамический контент, возможно, даже настолько, насколько просто ищет строки и отменяет экранирование контента, что является всем, что необходимо для вашего примера. Это далеко от фактического запуска скриптов, о чем был исходный вопрос. - person Matthew Scharley; 28.04.2014
comment
Не думаю. У меня есть доказательства, что он тоже запускает скрипты. Например, попробуйте поискать в Google следующее (в кавычках): "DeLaval requested a conference call to seek authorization to file a motion to strike Lely's preliminary response". Опять же, только один результат, полученный из фрагмента в поисковой системе Docket Alarm. Этого фрагмента не было во встроенном HTML или javascript, он был получен в результате вызова ajax, который генерирует фрагмент. (к сведению, кеш Google старый, поэтому фрагмента больше нет на странице). - person speedplane; 29.04.2014