CoderCastrov logo
CoderCastrov
Парсер

Парсинг данных Reddit-постов с использованием PRAW - пакета Python.

Парсинг данных Reddit-постов с использованием PRAW - пакета Python.
просмотров
1 мин чтение
#Парсер

Введение

PRAW (Python Reddit API Wrapper) - это пакет Python, который помогает нам парсить данные Reddit-постов с использованием API Reddit. Он очень прост в использовании для сбора данных о постах Reddit (посты Reddit обычно называются "submission") и, следовательно, для выполнения различных задач, таких как анализ настроений.

Здесь я расскажу вам о очень простом подходе, с помощью которого вы можете настроить и установить PRAW и работать с ним.

Предварительные требования

  • Знание Python
  • Учетная запись Reddit и понимание ее работы
  • Секретные ключи API

Шаг 1:

Сначала создайте учетную запись Reddit. Затем нажмите на выпадающее меню рядом с вашим именем профиля в правом верхнем углу. Нажмите на "Посетить старый Reddit" и затем на "Настройки" в правом верхнем углу. Затем выберите вкладку "Приложения" и оттуда вы получите возможность создать вкладку, выберите ее.

Шаг 2:

Введите имя вашего приложения, выберите меню скриптов и дайте описание в поле описания. Вы можете оставить поле "URL о приложении", но вам нужно заполнить "URI перенаправления". Введите "http://localhost:8080" в разделе URI перенаправления и нажмите вкладку "Создать приложение".

Шаг 3:

После выбора вкладки "Создать приложение" вы получите два ключа (см. изображение ниже). Тот, помеченный 1, является client_id, который состоит из 14 символов, а тот, помеченный 2, является client_secret, который состоит из 27 символов. Запишите их.

API keys

Шаг 4:

Установите PRAW, используя pip install praw из командной строки Anaconda. Затем обратитесь к репозиторию GitHub https://github.com/diptaraj23/Scraping-Reddit-post-data-using-PRAW, чтобы получить подробное понимание о том, как работать с ним.