CoderCastrov logo
CoderCastrov
Tiktok Парсер

Как парсить данные TikTok в Node.js

Как парсить данные TikTok в Node.js
просмотров
2 мин чтение
#Tiktok Парсер
Table Of Content

    Для парсинга данных с TikTok в Node.js вы можете использовать библиотеку для парсинга веб-страниц, такую как Puppeteer или Cheerio. Обе эти библиотеки позволяют имитировать веб-браузер и взаимодействовать с веб-страницами, включая TikTok, чтобы извлекать данные из них.

    Вот пример использования Puppeteer для парсинга данных с TikTok:

    const puppeteer = require('puppeteer');
    
    async function scrape() {
      // Запуск экземпляра браузера в безголовом режиме
      const browser = await puppeteer.launch();
    
      // Открытие новой страницы в браузере
      const page = await browser.newPage();
    
      // Переход на домашнюю страницу TikTok
      await page.goto('https://www.tiktok.com/');
    
      // Ожидание полной загрузки страницы
      await page.waitForSelector('.video-feed-item');
    
      // Извлечение данных со страницы
      const data = await page.evaluate(() => {
        // Получение видео на странице
        const videos = document.querySelectorAll('.video-feed-item');
    
        // Извлечение данных из каждого видео
        return Array.from(videos).map(video => {
          const linkElement = video.querySelector('.cover-inner-wrap a');
          const link = linkElement ? linkElement.getAttribute('href') : null;
    
          const authorElement = video.querySelector('.author-name a');
          const author = authorElement ? authorElement.innerText : null;
    
          const titleElement = video.querySelector('.video-title-content');
          const title = titleElement ? titleElement.innerText : null;
    
          return {
            link,
            author,
            title,
          };
        });
      });
    
      // Закрытие браузера
      await browser.close();
    
      // Возврат полученных данных
      return data;
    }
    
    // Парсинг данных и вывод в консоль
    scrape().then(console.log);

    В приведенном выше коде Puppeteer используется для запуска безголового браузера и перехода на домашнюю страницу TikTok. После полной загрузки страницы Puppeteer использует функцию page.evaluate() для выполнения JavaScript-кода на странице и извлечения данных со страницы. Затем данные возвращаются и могут быть использованы по необходимости.

    В качестве альтернативы вы можете использовать Cheerio для парсинга данных с TikTok. Вот пример использования Cheerio для этого:

    const axios = require('axios');
    const cheerio = require('cheerio');
    
    async function scrape() {
      // Отправка HTTP-запроса на домашнюю страницу TikTok
      const response = await axios.get('https://www.tiktok.com/');
    
      // Парсинг HTML-ответа с помощью Cheerio
      const $ = cheerio.load(response.data);
    
      // Извлечение данных со страницы
      const data = $('.video-feed-item').map((i, video) => {
        const link = $('.cover-inner-wrap a', video).attr('href');
        const author = $('.author-name a', video).text();
        const title = $('.video-title-content', video).text();
    
        return {
          link,
          author,
          title,
        };
      }).get();
    
      // Возврат полученных данных
      return data;
    }