CoderCastrov logo
CoderCastrov
Индия

Анализ настроений бюджета Индии 2019 года с использованием правил на основе nltk

Анализ настроений бюджета Индии 2019 года с использованием правил на основе nltk
просмотров
2 мин чтение
#Индия
Table Of Content

    Это небольшая попытка провести анализ настроений последнего индийского бюджета, представленного министром финансов Нирмалой Ситараман 5 июля 2019 года.

    Данные для анализа настроений были собраны (с использованием библиотеки "requests") из статьи Times of India (https://timesofindia.indiatimes.com/business/india-business/budget-2019-highlights-gst-rate-on-electric-vehicles-to-be-lowered-from-12-to-5/articleshow/70084365.cms). Количество комментариев, взятых из этой статьи, составляло 300.

    Анализ настроений был выполнен с использованием правил на основе метода nltk's SentimentIntensityAnalyzer с использованием словаря vader_lexicon. Поскольку размеченные данные не были доступны, был выбран метод на основе правил вместо метода обучения для классификации настроений.

    Облако слов для нейтральных комментариев

    Neutral comments

    Облако слов для положительных комментариев

    Positive comments

    Облако слов для отрицательных комментариев

    Negative comments

    Из всех сегментов кажется, что одним из выделенных слов является "средний класс" или "заработная плата". Одной из причин может быть то, что аудитория этой статьи в основном состоит из этого класса и обсуждает в основном вопросы, связанные с налогом на доходы.

    И "Моди" кажется самым выделенным словом в разделе положительных настроений.

    Топ-места вовлечения

    На основе доступных данных о местоположении вовлеченных пользователей на графике ниже показаны топ-8 местоположений/городов пользователей и настроения из этих городов.

    Топ-8 городов настроений

    Похоже, что Бангалор недоволен бюджетом, в то время как большинство других городов кажется довольными. Это может быть связано с тем, что в Бангалоре проживает большое количество лиц с высокими заработками.

    Настроения к наиболее понравившимся или не понравившимся комментариям

    Ниже приведен анализ топ-15 комментариев, которые были понравившимися/не понравившимися, и настроения по этим комментариям.

    Настроения топ-15 понравившихся комментариев

    Настроения топ-15 понравившихся комментариев

    Настроения топ-15 не понравившихся комментариев

    Настроения топ-15 не понравившихся комментариев

    Похоже, что топ-понравившиеся/не понравившиеся комментарии являются оба "отрицательными" комментариями о бюджете, однако большинство комментариев, которые не понравились, кажется относящимися к отрицательным комментариям, а не к положительным или нейтральным.