CoderCastrov logo
CoderCastrov
Парсер

Как парсить и автоматически публиковать видео с YouTube-канала на WordPress

Как парсить и автоматически публиковать видео с YouTube-канала на WordPress
просмотров
3 мин чтение
#Парсер

В этом руководстве мы рассмотрим все шаги, которые вам понадобятся для автоматической публикации и парсинга видео с YouTube-канала с предопределенным именем пользователя или канала. Для этой цели мы будем использовать канал YouTube WordPress TV, и результаты будут отображаться на нашем веб-сайте с заголовком, описанием и встроенным видео.

Поскольку видео YouTube не являются загружаемыми статическими видеофайлами, такими как mp4, вы не можете к ним прямо обратиться. Поэтому функциональность встроенного видео по умолчанию в WordPress поможет нам воспроизводить их как видео в нашей области контента.

Поскольку страницы каналов YouTube работают на JavaScript, на самом деле они не подходят для "последовательного" парсинга. Но благодаря поддержке RSS-каналов YouTube мы сможем сделать это.

Нахождение правильного URL-адреса

URL-адреса каналов YouTube могут иметь три различные формы.

https://www.youtube.com/c/[ИМЯ_КАНАЛА][https://www.youtube.com/channel/НЕКОТОРЫЙ_ДЛИННЫЙ_ID]https://www.youtube.com/user/[НЕКОТОРОЕ_ИМЯ_ПОЛЬЗОВАТЕЛЯ]

Но метод будет одинаковым для всех видов URL-адресов. Сначала нам нужно перейти по URL-адресу нашего канала и щелкнуть правой кнопкой мыши. Затем щелкните на Просмотреть исходный код страницы или Исходный код страницы в вашем браузере. Во многих браузерах также есть сочетание клавиш Ctrl + U.

Когда вы нажимаете на исходный код страницы, вы увидите множество тегов HTML, кодов JavaScript и т. д. Затем мы будем искать ключевое слово "rssUrl" на этой странице с помощью сочетания клавиш Ctrl + F.

Как видите, там будет URL-адрес, заканчивающийся на videos.xml?channel_id=[НЕКОТОРЫЙ_АЛФАНУМЕРИЧЕСКИЙ_ID], это то, что мы будем использовать в настройках нашей задачи парсинга.

Для нашего примера URL-адрес RSS WordPress TV выглядит так: https://www.youtube.com/feeds/videos.xml?channel_id=UCpJf6LGZ0a4n9Lj4aVt9spg

Это то, что вы видите, если правильно нашли адрес в вашем браузере.

Создание задачи парсинга

Итак, у нас есть URL-адрес ленты, и теперь мы можем создать задачу парсинга типа "Лента". Если вы хотите узнать больше о типах задач парсинга "Одиночный" и "Последовательный", вы можете прочитать нашу другую статью, нажав здесь.

Редактирование заголовка, содержимого и изображения записи

Для заголовка записи мы должны выбрать "Обнаружить из ленты", для содержимого записи сначала нажмите на опцию "Включить шаблон", перейдите на вкладку "Текст" и нажмите на синюю кнопку "вставить". Таким образом, в нашем разделе контента автоматически добавится встроенное видео. Вы также можете написать [вставить][scrape_url][/вставить] вручную.

Если вам также нужно описание текста с YouTube, вам нужно выбрать опцию "Выбрать из источника", написать //meta[@name="description"]/@content в поле ввода и также нажать на синюю кнопку "содержимое". Вы также можете написать [scrape_content] вручную.

Вы можете изменить порядок содержимого, встроенного видео или написать свой собственный текст здесь. Этот раздел очень гибкий для вашего разработанного вывода.

Затем вы можете отметить "Включить правила поиска и замены" и написать content="(.*?)" в поле "Найти", $1 в поле "Заменить".

Для изображения записи вам нужно выбрать "Выбрать из источника" и написать //meta[@property="og:image"]/@content в поле ввода.

В целом, разделы должны выглядеть так, как показано на этих скриншотах:

Заголовок записи

Содержимое записи

Изображение записи

Отметьте опцию "Выбрать из источника" и напишите //meta[@property="og:image"]/@content в поле ввода. Вот и все.

В целях простоты мы не будем изменять другие значения по умолчанию, но вы, конечно, можете назначать категории, изменять тип "записи" на другой пользовательский тип записи, устанавливать значение повторяемости, настраивать предпочтения "обновления записи" и т. д. После успешного запуска и сохранения задачи вы увидите последние пятнадцать записей в разделе "записи".

Итак, вот окончательный результат нашей записи с текущими настройками.

Вкратце, мы сначала нашли URL-адрес RSS-канала YouTube для нашего автоматического блога. Затем мы использовали Scrapes как плагин автоблога WordPress RSS, и, наконец, задача будет проверять последние 15 записей каждый день для нас с настройками по умолчанию.

БОНУС: Вот несколько идей для каналов, которые мы придумали с нашими клиентами, которые парсят каналы. Это может дать вам подсказку для поиска разных каналов YouTube для вашего веб-сайта.

Предпринимательство, концерты, игры, музыка, культура, электроника, альбомы, телеканалы, артисты, поп-певцы, документальные фильмы, развлечения, футбол, телесериалы, знаменитости, трейлеры фильмов, видео с распаковкой, короткие клипы для социальных сетей, еда и напитки, рецепты, наука, животные, стримы, программирование, наука о данных, онлайн-обучение, мода, путешествия, образ жизни, одежда, аниме, рукоделие, сделай сам, новости, финансы, криптовалюта, лиги, официальные спортивные клубы, география, автомобили, влиятельные личности, видео-компиляции, иностранные языки, музыкальные жанры, религия, киберспорт, советы по технике, радиостанции, макияж, математика, физика, челленджи, фитнес, бодибилдинг, церкви, телешоу, клубы, изобразительное искусство, критики фильмов, обзоры продуктов, фотография

Если вы хотите узнать больше и увидеть Octolooks Scrapes в действии, попробуйте нашу живую демонстрацию бесплатно, для получения дополнительной информации и вопросов не стесняйтесь связаться с нами.

Octolooks Scrapes - Демо

Описание

scrapes.octolooks.com