CoderCastrov logo
CoderCastrov
Веб-разработка

Как создать парсер на Java?

Как создать парсер на Java?
просмотров
1 мин чтение
#Веб-разработка
Table Of Content

На прошлой неделе я закончил финальный проект в классе по Java.

Наш проект - это рекомендатель подарков, который рекомендует подарки с сайта на основе персональных данных.

Я сделал презентацию об этом и получил вопрос о парсере, который создается на Java.

Итак, я расскажу об этом здесь.


Я создал парсер, чтобы получить заголовки статей с Medium, вот так.

Он действительно простой.

Я использую Jsoup для создания парсера, это действительно хорошая библиотека с открытым исходным кодом.

Первая строка - я получаю весь HTML-документ из URL, конечно, его можно записать как директорию, например "search?q=Java".

Но использование метода data более понятно и гибко.

Вторая строка - получение элементов с именем класса "graf--title" для получения названия заголовка. Заголовок истории находится внутри тега div с классом "graf--title" в HTML.

Также можно использовать множество методов для получения элементов, например "getElemetsById" и "getElementsByAttribute" и другие, выбор метода зависит от цели.

С третьей по шестую строку - просто вывод каждого заголовка. Вот и все.


Summary

Reference

Shiozaki-s21/JavaScraping


Переведи введенный markdown код с английского на русский. Сохрани оригинальную разметку markdown и изображения на своих местах. Вместо слов скрэпинг/скрапинг/скрапер/скрэпер используй парсинг/парсер/парсить. Возвращай только markdown код, без дополнительного текста