CoderCastrov logo
CoderCastrov
Автоматизация

Бассейн идей - Автоматизация получения статей новостного портала для PR-линкбилдинга

Бассейн идей - Автоматизация получения статей новостного портала для PR-линкбилдинга
просмотров
2 мин чтение
#Автоматизация

Я хочу вести инвентарь статей, опубликованных онлайн на новостном портале, который является коллективным порталом издателей новостей. Поэтому я написал скрипт AHK для парсинга новостного портала и получения названий статей.

С такой настройкой у меня будет .txt файл со всеми заголовками, кроме того, можно настроить время парсинга, чтобы повторять действие, скажем, каждые 15 минут, когда новостной портал обновляет веб-контент.

Таким образом, мой список будет автоматически обновляться.

Для чего это все хорошо?

Я подготовлю пул заголовков статей, которые будут в моем распоряжении, и у меня будет возможность фильтровать их.

Если я найду что-то интересное, я смогу позже просмотреть содержимое, вернуться в прошлое и провести исследование или получить вдохновение.

ЗАТЕМ ЧТО-ТО ИЗМЕНИЛОСЬ

Я решил, что хочу получить URL-адреса статей, и потом потерпел неудачу.

Я пытался и пытался, искал информацию, читал тонны форумов.

Но ничего. Я нашел способ извлечь URL-адреса отдельно, но не URL-адреса статей, а вообще все URL-адреса.

Черт.

Хорошая вещь в AHK в том, что за ним стоит огромное сообщество, которое оказывает помощь быстро и эффективно, поэтому я обратился за помощью на Reddit, в группу AHK.

Угадайте, через день кто-то ответил на мой пост, попросил правильно отформатировать мой код, и уже на следующий день было предложено решение.

Которое не сработало.

Но я понял, что код AHK v2 не будет выполняться на установленной версии v1.

Так что эта проблема решена.

Пример результата парсинга новостных статей

Хотите получить обновленный скрипт?

Вот он.

F1::ПолучитьURLСтатей()

ПолучитьURLСтатей() {
    URLDownloadToFile https://www.hirstart.hu, % A_Temp "\html"
    FileRead html, % "*PP65001 " A_Temp "\html"
    html := StrReplace(html, "<head>", "<head><meta http-equiv='X-UA-Compatible' content='IE=Edge'>")
    document := ComObjCreate("HTMLFile")
    document.write(html)
    headers := document.querySelectorAll("h2 a")
    all := ""
    loop % (headers.length - 1) {
        elem := headers[A_Index - 1]
        if (elem.href ~= "^http")
            all .= elem.innerText "`t" elem.href "`n"
    }
    ObjRelease(document)
    FileDelete % A_Temp "\html"
    FileOpen(A_Desktop "\hu.csv", 0x1, "UTF-8").Write(all)
    MsgBox 0x40040, Завершено!, Парсинг с hirstart.hu завершен!
}

Где вы можете получить вдохновение из новостных статей?

Конечно, в своей собственной PR-стратегии по созданию ссылок.

Прочитайте подробности ниже:

Внутренний завод по созданию ссылок для увеличения органического трафика и повышения осведомленности о бренде

Создание ссылок имеет высший приоритет при разработке стратегий SEO.

medium.com

Вы не знаете, как использовать Autohotkey?

Я также только падаван по этой теме, но энтузиаст.

Вы можете смело обратиться к сообществу AHK, если вам нужна помощь. Они будут рядом с вами.


MacLoush - Medium

Читайте записи MacLoush на Medium и следите за ним. Советы по автоматизации рабочего стола | Цифровой маркетинг | Воспитание детей | Сбережения | Инвестиции...

medium.com