CoderCastrov logo
CoderCastrov
Парсер

Парсинг данных с Twitter и Youtube (python)

Парсинг данных с Twitter и Youtube (python)
просмотров
1 мин чтение
#Парсер
Table Of Content

    Парсинг - это процесс извлечения данных с веб-сайта. В связи с развитием больших данных, количество доступных данных стало несметным. Парсинг позволяет собирать данные быстрее, так как он может выполнять автоматизацию.

    (1) Существует много способов получить данные (парсинг) с Twitter.

    a. Использование API Twitter (Рекомендуется использовать API, доступ к парсингу можно получить здесь)

    b. Без использования API Twitter. Я часто использую GetOldTweets и Twitterscraper.

    Для парсинга данных из социальных медиа необходимо установить несколько библиотек. Вот шаги для установки библиотек в Python и пример получения данных с определенным ключевым словом.

    Результат будет выглядеть следующим образом:

    Далее, если требуется получить данные с несколькими ключевыми словами одновременно.

    Хотите сосредоточиться только на определенном аккаунте? Вот скрипт, который можно попробовать.

    О, оказывается, хочется получить данные сразу нескольких аккаунтов.

    Затем, когда вы уверены в данных и хотите сохранить их (измените параметры по необходимости).

    1. Twitterscraper (нажмите здесь)Подсказка: не более 5 минут для попробовать, очень просто, подходит для работы только с ключевыми словами.

    Оба варианта можно попробовать, какой лучше? Выбирайте в зависимости от использования и потребностей :)

    (2) Парсинг Youtube

    Да, данные с этой видео-платформы также могут быть получены. Это комментарии к видео. Комментарии в видео на Youtube считаются интересными и важными. Способы парсинга комментариев на Youtube постоянно улучшаются. Один из способов, которым я пользуюсь для парсинга комментариев на Youtube, - это YouTube Comment Scraper (разработка продолжается, но веб-сайт можно найти здесь, а инструкции по использованию можно найти здесь)

    Вот немного информации от меня, надеюсь, что помогло (ссылки на источники)