CoderCastrov logo
CoderCastrov
Data Journalism - Журналистика данных

Извлечение данных с любого веб-сайта в четыре простых шага с использованием Instant Data Scraper

Извлечение данных с любого веб-сайта в четыре простых шага с использованием Instant Data Scraper
просмотров
2 мин чтение
#Data Journalism - Журналистика данных
Chart: theoutlier.co.za

Некоторое время назад я создал эту диаграмму, которая показывает, сколько зарабатывают африканские игроки в Английской премьер-лиге, используя данные с веб-сайта Capology, который предоставляет информацию о зарплатах футбольных игроков, контрактах и финансовых отчетах клубов топовых футбольных лиг мира.

Но получение конечного результата было небольшим вызовом, потому что обычный метод "копировать и вставить", который обычно был достаточным при извлечении данных с веб-сайтов, не работал на этом конкретном веб-сайте. Затем я нашел Instant Data Scraper, автоматизированный инструмент для извлечения данных.

Я много работаю с данными о спорте, в основном найденными на веб-сайтах, и этот инструмент работает намного лучше и экономит много времени. Вот как вы можете использовать его в четыре простых шага.

Шаг 1: Установка

Установите Instant Data Scraper в качестве расширения для Chrome, нажав на кнопку "Добавить в Chrome" и затем на кнопку "Добавить расширение", которая появится сразу после этого.

Step 1

Теперь давайте начнем извлекать данные...

Шаг 2: Извлечение данных

Мы будем использовать данные о зарплатах команд Серии А на сезон 2022/23 года с сайта Capology для этого упражнения. На сайте они представлены следующим образом:

Step 2

Целью сейчас является извлечение данных с веб-сайта и преобразование их в электронную таблицу, чтобы они были в удобном формате, который можно было бы обрабатывать.

После открытия страницы используйте расширение Chrome, которое вы найдете, нажав на значок пазла в правом верхнем углу вашего браузера.

Step 3

После нажатия на расширение оно представит данные в следующем формате, и вы сможете сделать с ними несколько вещей перед загрузкой.

Step 4

Используйте крестик в правом верхнем углу каждого столбца, чтобы удалить любой столбец, который вам не нужен. Если вы случайно удалили столбец, который вам нужен, вы можете нажать "Сбросить все", чтобы восстановить все столбцы в исходном формате.

Step 5

Шаг 3: Получение данных

Когда вы удовлетворены своими данными, скопируйте их в свою таблицу, нажав на "Копировать все", а затем вставьте их. Или загрузите их в формате CSV или XLSX.

Шаг 4: Использование данных

После того, как у вас есть данные в таблице, вы можете использовать наши формулы таблицы или функции таблицы для манипулирования данными. Ознакомьтесь с нашим руководством по Flourish и Figma, чтобы создать пользовательские диаграммы с использованием только что извлеченных и обработанных данных.


Media Hack Collective предлагает обучение журналистов по работе с данными_ на всем континенте Африки и публикует данные журналистику на_ The Outlier, которая включает в себя растущую коллекцию диаграмм_ и_ информационные бюллетени на основе данных.