CoderCastrov logo
CoderCastrov
Фейсбук

Извлечение данных из страниц и групп Facebook с помощью Python

Извлечение данных из страниц и групп Facebook с помощью Python
просмотров
2 мин чтение
#Фейсбук

В этой статье мы познакомимся с библиотекой facebook-scraper, давайте начнем.

Сначала давайте ответим на вопрос, почему мы не используем Facebook Graph API?

Graph API - это API, который позволяет нам извлекать данные из страниц и групп Facebook. Он не только предназначен для этой цели, но также имеет функции входа, статистики пользователей и многие другие. Однако наша цель - только извлечение данных из страниц и групп. Из-за некоторых причин безопасности Graph API не позволяет нам получать доступ к данным даже в открытых страницах или группах.

Например:

Мне понадобилось извлечь данные из группы Facebook. Сначала я сделал это из своей собственной группы и узнал, как это работает. Затем я перешел к группе, из которой мне нужны данные, но API не дал мне это сделать. Когда я прочитал форумы, я узнал, что раньше это было разрешено, но из-за причин безопасности теперь это невозможно.

Теперь давайте изучим нашу библиотеку;

Сначала установим нашу библиотеку Python.

pip install facebook-scraper

Добавим нашу библиотеку в любой открытый файл .py.

from facebook_scraper import get_posts

Теперь, когда мы добавили нашу библиотеку, мы можем начать извлекать данные.

for post in get_posts('название-страницы', pages=1):
            print(post['text'])

Вместо 'название-страницы' вставляем идентификатор после 'facebook.com/'.

Например, ссылка на страницу Turkish Airlines на Facebook выглядит так:

https://www.facebook.com/TurkishAirlinesTR

Мы берем часть после '/', и добавляем ее. Теперь давайте получим текст сообщений, которые он отправил. Код будет выглядеть следующим образом:

from facebook_scraper import get_posts
for post in get_posts('TurkishAirlinesTR', pages=1):
    print(post['text'])

Этот фрагмент кода предоставит нам все данные на первой странице.

Если вы хотите получить другие страницы, вы можете изменить 'pages=1' на желаемое количество страниц.

facebook-scraper предоставляет нам данные в формате 'ключ=значение'.

Этот пример был о том, как извлечь данные из страницы. Если вы хотите извлечь данные из группы, просто замените 'get_posts(group='название-группы', pages=1)'.

Чтобы получить больше помощи, вы можете написать в командной строке:

$ facebook-scraper --help

Или вы можете прочитать документацию ниже.

kevinzg/facebook-scraper

Парсинг публичных страниц Facebook без использования ключа API. Внесите свой вклад в развитие kevinzg/facebook-scraper, создав...

github.com


Faydalı olması dileğiyle...

Github аккаунт:

kemaleb - Обзор

Отклонить Регистрация на собственный профиль на GitHub, лучшем месте для размещения кода, управления проектами и создания программного...

github.com