CoderCastrov logo
CoderCastrov
Excel

Как использовать Excel в качестве инструмента для парсинга веб-страниц

Как использовать Excel в качестве инструмента для парсинга веб-страниц
просмотров
3 мин чтение
#Excel
Table Of Content

    Microsoft Excel - один из наиболее предпочитаемых инструментов для управления информацией в структурированной форме. Это многофункциональное программное обеспечение с отличными возможностями и функциями. Вот как Excel можно использовать в качестве базового инструмента для парсинга веб-страниц для извлечения данных непосредственно в рабочий лист. Для этого мы воспользуемся запросами веб-страниц в Excel.

    Запросы веб-страниц - это функция Excel, которая используется для извлечения данных с веб-страницы в рабочий лист Excel. Excel может автоматически находить таблицы на веб-странице и позволяет выбрать конкретную таблицу, из которой нужно извлечь данные. Запросы веб-страниц также могут быть полезны в случаях, когда невозможно поддерживать соединение ODBC, кроме извлечения данных с веб-страниц. Давайте посмотрим, как работают запросы веб-страниц и как можно выполнить парсинг HTML-таблиц с веб-страниц.

    Перейдем к делу

    Давайте начнем с простого запроса веб-страницы для извлечения данных с страницы Yahoo! Finance. Эта страница является более простой для парсинга, поэтому она хорошо подходит для изучения этого метода. Страница также довольно прямолинейна и не содержит много важной информации в виде ссылок или изображений. Вот URL-адрес, который мы будем использовать для учебного пособия:

    http://finance.yahoo.com/q/hp?s=GOOG

    Создание нового запроса веб-страницы:

    1. Выберите ячейку, в которой вы хотите, чтобы данные появились.
    2. Нажмите на Data-> From Web.
    3. Появится новое окно New Web query, как показано ниже.
    1. Введите URL-адрес веб-страницы, с которой вы хотите извлечь данные, в адресной строке и нажмите кнопку Go.
    1. Нажмите на желто-черные кнопки рядом с таблицей, из которой вы хотите извлечь данные.
    1. После выбора необходимых таблиц нажмите кнопку Import и вы готовы к работе. Excel начнет загружать содержимое выбранных таблиц в ваш рабочий лист.

    После того, как данные будут извлечены в ваш рабочий лист Excel, вы сможете сделать множество вещей, таких как создание диаграмм, сортировка, форматирование и т. д., чтобы лучше понять или представить данные в значимом виде.

    Настройка запроса

    После создания запроса веб-страницы вы можете настроить его в соответствии с вашими требованиями. Для этого откройте свойства запроса веб-страницы, щелкнув правой кнопкой мыши на ячейке с извлеченными данными. Снова откроется страница, с которой вы делали запрос, нажмите кнопку Options справа от адресной строки. Появится новое всплывающее окно, где вы сможете настроить взаимодействие запроса веб-страницы с целевой страницей. Вам предоставляются возможности изменить некоторые основные параметры, связанные с веб-страницами, такие как перенаправления и форматирование.

    Кроме того, вы также можете изменить параметры диапазона дат, щелкнув правой кнопкой мыши на случайной ячейке с результатами запроса и выбрав свойства диапазона данных. Появится диалоговое окно свойств диапазона данных, где вы сможете внести необходимые изменения. Вы можете переименовать диапазон данных в что-то, что вы сможете легко распознать, например, "Ценные бумаги".

    Автообновление

    Автообновление - это особенность запросов веб-страниц, которая стоит упомянуть и которая делает наш парсер веб-страниц в Excel действительно мощным. Вы также можете сделать извлеченные данные автоматически обновляемыми, чтобы ваш рабочий лист Excel обновлял данные при изменении исходного веб-сайта. Вы также можете установить, как часто вам нужно обновлять данные с веб-страницы в меню параметров диапазона данных. Функцию автообновления можно включить, установив флажок рядом с "Обновлять каждые" и установив желаемый интервал времени для обновления данных.

    Парсинг веб-страниц в большом масштабе

    Хотя извлечение данных с помощью Excel может быть отличным способом для парсинга HTML-таблиц с веб-страниц, это далеко не является настоящим решением для парсинга веб-страниц. Это может быть полезно, если вы собираете данные для исследовательской работы в колледже или если вы любитель, ищущий более дешевый способ получить некоторые данные. Если вам нужны данные для бизнеса, вам придется полагаться на опытного поставщика парсинга веб-страниц, который обладает опытом работы с парсингом веб-страниц в большом масштабе. Внештатное выполнение сложного процесса также поможет вам сэкономить драгоценное время, которое вы можете вложить в маркетинг вашего бизнеса.