CoderCastrov logo
CoderCastrov
Парсер веб-страниц

Cheerio — Извлечение текста вне элементов HTML

Cheerio — Извлечение текста вне элементов HTML
просмотров
1 мин чтение
#Парсер веб-страниц
Table Of Content

    October 5, 2021_, Опубликовано на cambotutorial.com _・1 мин чтения

    Для парсинга или навигации по элементам HTML мы можем использовать фреймворк jQuery или Cheerio для выбора элементов HTML с помощью селектора, но иногда мы сталкиваемся с проблемой, когда мы хотим получить только текст Hello, который находится вне тега (без обертки тегом). Поэтому сегодня я покажу вам очень короткий пример извлечения текста из HTML-элемента без родительского элемента.


    **Читайте также: **Добавление дней или часов к дате и времени в PHP


    Пример: У меня есть следующий формат HTML, и я хочу получить текст Hello, который не имеет обертки тегом.

    <ul>
    <li>A</li>
    <li>B</li>
    <li>C</li>
    Hello
    </ul>

    Для этого мы будем фильтровать узлы по типу и затем пройдемся по каждому из этих узлов с помощью jQuery.

    var $outer = $("ul").contents().filter((index,element) => element.nodeType === 3 && element.data !="\n");
    $outer.each((index,element) { console.log($(element).text());} );

    В итоге мы получим текст Hello


    Вам также может понравиться: