CoderCastrov logo
CoderCastrov
Парсер

ПАРСИНГ Tokopedia

ПАРСИНГ Tokopedia
просмотров
1 мин чтение
#Парсер
Table Of Content

    В этой статье я поделюсь информацией о том, как парсить данные с одного из веб-сайтов электронной коммерции - Tokopedia. Для объяснения самого парсинга можно посмотреть предыдущую статью о том, как парсить веб-сайты электронной коммерции с помощью Python. Прежде чем перейти к парсингу данных, давайте прочитаем файл требований для парсинга в формате pip3 -r requirements.txt. Здесь мы используем pip3, потому что я использую версию Python 3, для версии 3 и ниже можно использовать просто pip.

    После этого мы нажимаем ENTER и процесс будет обработан, как показано на следующем изображении.

    Следующий шаг - это парсинг данных, вводим формат scrapy crawl promo -o result_promo.json, чтобы получить файл json.

    После получения файла json мы можем проанализировать его с помощью инструментов, доступных в Python, таких как pandas. Для этого сначала нам нужно установить pandas, введя формат pip3 install pandas.

    Дальнейшие шаги можно увидеть в предыдущей статье. Для отображения файла будут получены следующие файлы.

    Хорошо, если у вас есть какие-либо вопросы, вы можете задать их в комментариях. Вот и все.