Откуда Google берет резюме для каждого из результатов своего сайта, которые он отображает на своей странице результатов поиска?

Я работаю над проектом, в котором мне нужно искать термины в поисковой системе, а затем кластерировать результаты по контексту. Поэтому я должен рассматривать каждый результат как документ. к сожалению, данных, представленных вместе с каждым результатом на странице результатов, слишком мало для кластеризации. Поэтому я хотел знать, откуда поисковые системы получают аннотацию для каждого результата, который они показывают. Если бы я мог получить всю эту аннотацию, я мог бы сгруппировать результаты, рассматривая их как отдельные документы.

Откуда гугл берет реферат? Например: Если вы ищете «1000 Mile» в Google, второй результат показывает следующее резюме: «Женская коллекция 1000 Mile основана на классическом дизайне и отражает давнее наследие Росомахи в создании качественной обуви. Дополнение к этой классике ..."

Этот реферат отсутствует в метатегах страницы.

Откуда Google находит эти данные.

Спасибо


person prasoonblueluck    schedule 06.10.2011    source источник


Ответы (2)


Этот сайт основан на Flash, и Google может индексировать Flash-контент, поэтому, учитывая, что фрагмента нет ни в исходном HTML-коде страницы, как вы указываете, ни в кешированной версии страницы, я предполагаю, что он где-то во Flash-ролике.

То, что во фрагменте упоминается «Коллекция 1000 миль для женщин», является произвольным, в то время как сама ссылка на сайт относится к родительской категории 1000 миль, а не только к женской, поэтому я предполагаю, что сбор удобных для фрагментов метаданных с Flash-сайта неточная наука. Это мое лучшее предположение.

В этом сообщении блога Google для веб-мастеров они объясняют как они используют внешние текстовые или HTML-файлы, загруженные во Flash-ролик, и в одном из комментариев Джонатан Саймон говорит (извините):

"Мы делаем все возможное, чтобы сканировать Flash-контент, но иногда результаты могут быть далеко не идеальными. Вы видите только заголовок в результатах поиска для своего сайта, потому что это единственный фрагмент HTML-текста, который у вас есть за пределами вашего Flash-контента. Вы можете добавить элемент мета-описания, чтобы предложить больше информации в формате HTML. Вы также можете добавить какой-либо другой текст, который не является частью вашего Flash-контента. Это должно улучшить фрагмент, связанный с вашим сайтом в результатах поиска. "

person Ralph Lavelle    schedule 06.10.2011

От Использует ли Google метатег описания для описания страницы?

Google будет выбирать фрагменты результатов поиска из следующих мест (не обязательно в этом порядке):

  1. Тег мета-описания страницы
  2. Список проекта Open Directory (ODP) страницы
  3. Содержимое страницы релевантно поисковому запросу

Если вы не хотите, чтобы Google использовал описание листинга ODP, вы можете указать им не делать этого с помощью следующего метатега:

<meta name="robots" content="NOODP">

Если вы хотите, чтобы Google использовал ваш тег мета-описания, убедитесь, что он уникален для каждой страницы. Также убедитесь, что он содержит точное описание содержимого страницы.

В случае отсутствия описания ODP и тега мета-описания Google будет использовать часть текста страницы в качестве описания. Этот текст будет содержать наиболее близкие совпадения с поисковым запросом. Я не видел никаких официальных ограничений на то, как долго это может быть, но пара предложений кажутся правильными.

В соответствующей заметке, если вы не хотите, чтобы фрагмент отображался на определенной странице, вы можете использовать следующий метатег, чтобы предотвратить его отображение:

<meta name="robots" content="nosnippet">

Советы Google по с помощью тега мета-описания.

Согласно этого сайта, "мета-описание обычно должно быть не более < em>от 145 до 150 символов, так как это максимальное количество символов, обычно отображаемое в Yahoo! и Google соответственно".

person John Conde    schedule 06.10.2011