CoderCastrov logo
CoderCastrov
Google Shopping

Как парсить данные о продуктах с Google Shopping?

Как парсить данные о продуктах с Google Shopping?
просмотров
4 мин чтение
#Google Shopping

Google предоставляет множество информации для внешних ресурсов, большая часть из которой может быть очень полезной, если она может быть извлечена и отформатирована правильно для предполагаемого конечного использования. В этом руководстве будет рассмотрено использование API результатов Google Shopping для извлечения данных с Google Shopping, в частности, для парсинга страниц продуктов Google. С помощью API Google Shopping вы можете легко парсить результаты SERP Google. Пользователи хотят использовать этот API для парсинга цен, описания, названия, отзывов, сравнения цен с различными онлайн-магазинами и других рекомендаций по продуктам.

Для этого руководства мы будем использовать продукт "DeWalt DCD771C2".

Очень важно понимать, что X-Byte Enterprise Crawling предлагает два API: API результатов продуктов Google и API результатов Google Shopping.

Google Product Results API против Google Shopping Results API

Оба этих API предназначены для парсинга информации, связанной с покупками или продуктовыми данными на Google, хотя у каждого из них есть свое особое применение. Google Shopping Results API используется для извлечения сводных результатов поиска при запросе в Google Shopping. Кроме того, вы можете очистить результаты по продавцу, цене и другим конкретным характеристикам и параметрам, которые являются уникальными для категории товара, в зависимости от того, определяет ли Google эти параметры или нет. Например, для продукта, такого как упомянутая выше дрель DeWalt, некоторые уникальные параметры могут включать вес, характеристики аккумулятора, размер патрона, типы питания и т. д. Эти параметры могут меняться в зависимости от введенного вами продукта.

Google Product Results API поможет вам парсить данные, возвращаемые с уникальных страниц продуктов на Google. Каждый блок продукта в результатах поиска Google Shopping будет направлять пользователя на страницу этого продукта.

Узнайте о страницах продуктов Google

Любая страница продукта Google является результатом работы платформы Google Shopping, где каждый продукт имеет уникальную страницу с различными идентифицирующими свойствами. Поэтому лучший способ мыслить о странице продукта - это рассматривать ее как целевую страницу для конкретного продукта. На странице продукта может содержаться название продукта, цена, отзывы, описание, рейтинг, характеристики, спецификации и цены от интернет-магазинов, различные продукты от производителя, а также аналогичные продукты от конкурентов. Каждый продукт здесь идентифицируется уникальным идентификационным номером.

Различные страницы продуктов Google доступны либо через непосредственное переход на страницу продукта, либо через ссылку из результатов поиска Google Shopping при поиске продуктов.

Начнем с страницы покупок Google, просто введите запрос "DeWalt DCD771C2". Мы сосредоточимся на первом результате страницы. Блок с результатами продукта будет увеличиваться, чтобы показать дополнительные детали о продукте при нажатии на заголовок. Вам следует обратить внимание на две ссылки внизу - "Связанные товары" и "Отзывы" - они перенесут вас на уникальную отдельную страницу продукта, показанную на рисунке выше.

Мы сделали снимок экрана из документации, иллюстрирующий разделы, которые можно спарсить на различных страницах продуктов. Полный анализ страницы, список доступных параметров и возвращаемый вид данных в формате JSON можно найти там.

Теперь мы воспользуемся песочницей для имитации поиска. Эта песочница вернет ссылку на спарсенные данные в форматах JSON и HTML. Для тех, кто еще не пользовался нашей песочницей, это панель инструментов, которая предлагает простой и быстрый способ использования наших API и соответствующих параметров. Просто убедитесь, что вы установили тип вашего поиска в верхнем левом углу Google Product.

Теперь следующий параметр для адреса - это поле поиска идентификатора продукта (product_id). Это поле поиска идентифицирует продукт, о котором будет запрашиваться информация, и принимает только уникальный идентификатор продукта, предоставленный Google. Номер происходит из URL-адреса страницы продукта, сразу после "product/", и здесь это 2478210754218635618.

Когда все параметры установлены, нажмите на кнопку поиска, и вы увидите, что API вернул несколько визуальных результатов на этой странице - результаты в форматах JSON и HTML. Используйте ссылки, предоставляющие эти результаты, нажав кнопку "Экспорт в код" в правом верхнем углу. В раскрывающемся меню вы получите ссылку на JSON и HTML URL, а также версии кода параметров запросов в 8 различных средах или языках.

Вы также можете перейти к результатам спарсенных данных, следуя ссылкам JSON или HTML.

Мы надеемся, что теперь у вас есть ясное представление о том, как парсить данные из Google Shopping. Однако, если у вас возникли сомнения относительно интеграции с Google Shopping, парсинга Google Shopping или вы хотите использовать наш парсер Google Shopping или API поиска Google Shopping, свяжитесь с нами!