CoderCastrov logo
CoderCastrov
Парсинг

ПАРСИНГ Tokopedia

ПАРСИНГ Tokopedia
просмотров
1 мин чтение
#Парсинг
Table Of Content

    В этой статье я поделюсь информацией о том, как собирать данные с одного из веб-сайтов электронной коммерции - Tokopedia. Для объяснения самого парсинга веб-сайтов можно посмотреть предыдущую статью о том, как парсить веб-сайты электронной коммерции с помощью Python. Прежде чем перейти к сбору данных, давайте прочитаем файл требований для парсинга в формате pip3 -r requirements.txt. Здесь мы используем pip3, потому что я использую версию Python 3, для версий 3 и ниже можно использовать просто pip.

    После этого мы нажимаем ENTER и процесс будет выполнен, как показано на следующем изображении.

    Следующим шагом является сбор данных с помощью ввода формата scrapy crawl promo -o result_promo.json, чтобы получить файл json.

    После получения файла json мы можем проанализировать его с помощью инструментов, доступных в Python, таких как pandas. Для этого сначала нам нужно установить pandas, введя формат pip3 install pandas.

    Следующий шаг можно увидеть в предыдущей статье. Для отображения файла будут получены следующие файлы.

    Хорошо, если у вас есть вопросы, вы можете задать их в комментариях. Вот и все.