CoderCastrov logo
CoderCastrov
Парсер

Овладейте Python, создав парсер для актуальных новостей на kumparan.com - Часть 1

Овладейте Python, создав парсер для актуальных новостей на kumparan.com - Часть 1
просмотров
2 мин чтение
#Парсер

Проектирование вашей системы

Python известен как язык программирования, который легко изучить. Однако нам все равно нужно знать, какой путь выбрать, чтобы быстро и эффективно его освоить. Первое, что вам нужно знать, это ваша конечная цель. Существует множество учебных пособий, которые показывают вам несколько синтаксических конструкций, как их использовать и т. д. Такие учебники не плохи, они могут быть очень полезными. Допустим, вы пытаетесь исправить что-то в своем коде, вы ищете это в Google, и, возможно, попадаете на такой учебник, который решает вашу проблему.

Но дело в том, что если у вас нет конечной цели и вы просто учитесь программировать, вы будете крутиться вокруг этих синтаксических конструкций. Лучше учиться, создавая какие-то проекты. Выучить основы> Сделать что-то в проекте> Выучить что-то> Сделать что-то в проекте, и так далее. Это будет более эффективно, чем просто изучение синтаксиса без каких-либо практических действий. Это также даст вам ощущение достижения, которое будет мотивировать вас еще больше.

В этой статье я покажу вам, как овладеть Python, создав парсер для актуальных новостей на kumparan.com. Я разделил его на 4 серии статей:

Конечная цель здесь заключается в том, чтобы вы знали весь процесс и были готовы создать свой собственный проект, даже выполнить работу в реальном мире.

Итак, как вы видите на картинке выше, это дизайн системы, которую мы создадим для парсинга данных актуальных новостей с kumparan.com. Я разобью это здесь.

Репозиторий PyPi

Здесь все начинается. Вы загружаете свою программу в репозиторий PyPi, чтобы другие могли ее использовать. Например, другие программисты, другие приложения и даже мы сами.

Процесс извлечения

После того, как мы получили код из репозитория PyPi, мы извлекаем данные актуальных новостей с kumparan.com, используя пакеты requests и beautifulsoup4.

Процесс отображения данных

После извлечения данных мы обрабатываем их и отображаем пользователю в виде текста, который легко понять.

Это объяснение системы парсера актуальных новостей. В следующей статье я объясню два модуля, которые мы используем - requests и beautifulsoup4. До тех пор увидимся в следующих историях.

Больше контента на plainenglish.io. Подпишитесь на наш бесплатный еженедельный бюллетень. Получите эксклюзивный доступ к возможностям написания и советам в нашем сообществе Discord.