Я работаю над проектом, в котором мне нужно искать термины в поисковой системе, а затем кластерировать результаты по контекстусильный>. Поэтому я должен рассматривать каждый результат как документ. к сожалению, данных, представленных вместе с каждым результатом на странице результатов, слишком мало для кластеризации. Поэтому я хотел знать, откуда поисковые системы получают аннотацию для каждого результата, который они показывают. Если бы я мог получить всю эту аннотацию, я мог бы сгруппировать результаты, рассматривая их как отдельные документы.
Откуда гугл берет реферат? Например: Если вы ищете «1000 Mile» в Google, второй результат показывает следующее резюме: «Женская коллекция 1000 Mile основана на классическом дизайне и отражает давнее наследие Росомахи в создании качественной обуви. Дополнение к этой классике ..."
Этот реферат отсутствует в метатегах страницы.
Откуда Google находит эти данные.
Спасибо