Существует множество способов автоматизации сбора данных по различным предметам. Один из лучших способов сделать это — парсинг результатов поисковых систем. В частности, для информации о продукте, такой как номер GTIN, поисковая система Google Shopping имеет глубокую базу данных с информацией о продукте и спецификациями.
SerpApi — это лучший простой способ парсить поисковые системы в Google Покупках, не беспокоясь о прокси-серверах, капчах или обнаружении ботов. В этом руководстве будет использоваться SerpApi, поэтому я добавлю несколько полезных ссылок здесь и ниже.
Документация по Google Shopping API: https://serpapi.com/shopping-results
Документация по API продуктов Google: https://serpapi.com/google-product-api
Рабочий процесс получения GTIN с помощью SerpApi состоит из нескольких шагов. Это связано с тем, что Google разделяет свой механизм покупок на несколько частей. Первая часть — это просто поиск продукта, о котором вам нужна информация, через SerpApi Google Shopping API:
Вы можете просто включить продукт, который вы ищете, с параметром q
и включить Google Покупки с помощью параметра tbm
, установленного на shop
, с базовым движком Google. В этом примере мы будем искать iPhone 12.
Получив наш продукт, мы можем получить product_id
из результата в результатах JSON. Именно этот product_id
Google использует для индексации этого конкретного продукта в этом конкретном перекосе, поэтому он понадобится нам для следующей части, которая является фактическим запросом с API продуктов Google.
Чтобы сделать запрос на получение полного списка спецификаций, в который включен GTIN, мы передадим product_id
из 14006401347372489646
для нашего iPhone и включим параметр specs
, но установим для него значение true
.
Именно в этих результатах JSON вы найдете GTIN под universal_product_identifiers
. Для этого iPhone 12 GTIN — 00194252028179
.
Вы можете зарегистрироваться в SerpApi здесь: https://serpapi.com/
Вы можете найти форум пользователей SerpApi здесь: https://forum.serpapi.com/
Вы можете найти документацию по API здесь: https://serpapi.com/search-api/