CoderCastrov logo
CoderCastrov
Парсер

Частоты насильственных хэштегов в Parler

Частоты насильственных хэштегов в Parler
просмотров
7 мин чтение
#Парсер

Я запустил парсер для сбора сотен миллионов сообщений на Parler до того, как Amazon их закрыл за размещение ненавистной речи, теорий заговора, угроз насилия и дезинформации.

Пользователи могли искать сообщения на Parler (называемые "Парли") только по хэштегам, а не по содержанию текста в самом сообщении. Это побудило пользователей щедро применять хэштеги к любому Парли, которое они хотели широко распространить, предоставляя ценные метаданные исследователям, таким как я.

Например, вот случайный Парли от 6 января в Вашингтоне, округ Колумбия.

#trump должен был позволить #mikepence подписать свой собственный смертный приговор.....#TraitorPence #GITMO #firingsquad #ALLorNOTHING #2theEND #wildDC #magarally #wildprotest#saveamericarally #trumprally #dc #ArrestPence #traitorVP #JAN6 новый #911..... #makethempay #retribution

Это первая часть многотомного сериала, в котором я анализирую данные, собранные мной с Parler. В следующей части я использую эти данные вместе с отчетами Федеральной избирательной комиссии, чтобы представить аргументы в пользу того, что представитель из Джорджии, Марджори Тейлор Грин, могла совершить нарушения в финансировании кампании.

С 10 марта любой может искать полный набор данных и скачать мои полные данные со всеми архивными изображениями и видео из CDN Parler. Спасибо всем невероятным людям в Интернете, которые помогли сделать это возможным.

Висение политиков становится вирусным на Parler

Relative frequency of hashtags that call for execution by hanging — e.g. “pelosi4gallows”, “hangtraitors”, “bringbackpublicexecutions”, etc. Yes, those are real hashtags that were widely used.

Идея убийства политиков обсуждалась на Parler в течение нескольких месяцев до выборов в США 2020 года, часто в ответ на воспринимаемые несправедливости, совершаемые этими политиками. Частота хэштегов, связанных с повешением/казнью, более чем удваивается после выборов в США 2020 года (синяя вертикальная линия выше), более чем утраивается в день голосования в выборном коллегии (зеленая линия) и в десять раз выше в день штурма Капитолия (красная линия).

Вероятно, Parler позволил идее нападения и повешения политиков распространиться вирусно на платформе, скорее всего, из-за небрежности. Я считаю, что идея повешения, которая приобретала все большую популярность в онлайн-дискурсе, проявилась в возведенных за пределами Капитолия США эшафотах 6 января. Я считаю, что эшафоты являются отсылкой к литературе белых супрематистов The Turner Diaries, в которой "День Виселицы" предусматривает повешение политиков массово.

A reference to the “Day of the Rope” where dissenters from white supremacist groupthink are systematically murdered, followed in the story by violent reprisals against non-whites and nuclear armageddon.

Ниже приведен облако тегов хэштегов, связанных с сообщениями, в которых явно упоминается убийство конкретных политиков (Нэнси Пелоси, Джо Байден, AOC и даже малоизвестных демократов, таких как Эрик Суолуэлл).

Hashtags that show up more frequently have a larger font, and it should be no surprise that many of the 45th president’s campaign slogans are so closely associated.

На графике ниже хэштеги связаны и расположены ближе друг к другу, когда они часто упоминаются вместе. Теги группируются в сообщества, которые часто упоминаются вместе, и связи простираются между сообществами, чтобы указать на связь между различными темами обсуждения.

Visualizing discussion topics on Parler and how various discussions are linked by analyzing hashtag correlation.

Исследование набора данных

Я использую Wolfram Language для анализа, что позволяет мне выбирать и искать данные в наборе данных по конкретным темам обсуждения. Пока я случайно просматривал данные на основе хэштегов в графе обсуждения выше, я осознал, насколько сложно было бы модерировать такой разговор. Например, рассмотрим следующий пост:

Автор поста делится книгой о партизанской войне, которая доступна на Amazon. Я могу найти информацию об авторе по его идентификатору пользователя, и из его других постов и комментариев ясно, что он пытается подстрекать партизан к нападению на "глубинное государство". Amazon мудро не предоставляет платформу для распространения такой информации в цифровом виде, но это лишь приводит людей обратно к печатному прессе?

Следующий вирусный хэштег

После инцидента 6 января появилась одна особенная категория хэштегов, которая упоминалась чаще всего.

The use of hashtags calling for civil war_increased_by around 30% after the failed insurrection at the Capitol.

Хэштеги, связанные с гражданской войной, часто ассоциируются с движением "Бугалу" и кампанией Дональда Трампа. Возможно, мы увидим реальные последствия этой радикализации в ближайшие месяцы.

Using the Wolfram Language to visualize relative frequency of hashtags with the given keywords. You can see toward the end that posts about hanging politicians are being replaced by posts calling for civil war. Community associations of hashtags — these groups of tags are frequently mentioned together. Yellow and green are references to the Boogaloo movement, purple hashtags typically involve violence and anti-establishment topics, while red tags are typically associated with Donald Trump.

В мире 24-часовых новостных циклов и распространения онлайн-дезинформации хэштеги, по-видимому, коррелируют с тем, что популярно в Интернете в определенный момент времени. На Parler большинство пользователей просто "эхом" повторяли сообщения других пользователей - эквивалент ретвита на Parler.

Хэштеги и идентификаторы сообщений позволяют "отслеживать контакты" дезинформации по сети. В будущем посте я поделюсь своими идеями о способах измерения заразительности идеи и количественной оценки уровня радикализации пользователя.

Word cloud for hashtags on posts that explicitly call for civil war in America.

Заговор QAnon

Существует значительное количество американцев (включая двух находящихся в должности членов Конгресса США), которые верят в обширный глобальный заговор кабала поклоняющихся сатанистов-педофилов с целью консолидации власти, и что Дональд Трамп тайно пытается их свергнуть. Одной из особенностей заговора QAnon является то, что новые слои рационализации непрерывно добавляются через широко распространенные видео - в отличие от теорий заговора о посадке на Луну, предполагаемый заговор QAnon продолжается и непрерывно адаптируется к текущим событиям. По мере развития теории, это предоставляет возможности для любого пользователя Интернета внедрять в нее более опасные идеи.

Посты QAnon на Parler часто связываются с отрицанием COVID и верой в то, что Билл Гейтс/Джордж Сорос организовали пандемию, причем «доказательства» часто представлены в плохо отредактированных видео.

Это популярный пост QAnon, взятый из случайной выборки набора данных. Он был просмотрен более 181 000 раз, перепостован более тысячи раз, получил более тысячи голосов "вверх" и имеет 319 комментариев.

Джордж Сорос - миллиардер-инвестор, выживший Холокоста, и известный финансист либеральных инициатив.

Что дальше

Теперь вы можете прочитать часть 2, в которой данные указывают на то, что политическая кампания и супер PAC перевели более четверти миллиона долларов в Parler в течение одного месяца после выборов.

Internet Archive собирает гораздо более полный набор данных о сообщениях, изображениях, комментариях, пользователях и медиа-файлах из Parler, который я рекомендую использовать для анализа данным ученым. Мои планы на будущее для этого проекта:

  • Провести анализ естественного языка (NLP) и анализ тональности комментариев, которые пользователи оставляют под сообщениями, и определить, какие хэштеги связаны с какими настроениями
  • Анализ дезинформационных сайтов, скорости их распространения по социальной сети Parler и наиболее часто используемых хэштегов для каждого из них
  • Количественная оценка радикализации пользователя путем выявления статистически значимой тенденции к более насильственным идеям и хэштегам
  • Очистка данных и их общедоступность для исследователей

Вы можете связаться со мной относительно этой публикации и запросить доступ к набору данных, написав сообщение в Twitter или отправив письмо на contact@adatascienti.st. Я пытаюсь сохранить анонимность, чтобы эти истории не были связаны со мной - они должны быть о данных. Если вы прочитаете что-то еще, что я напишу и обнаружите партийную предвзятость, пожалуйста, указывайте на это, так как это противоречит всей сути написания этих материалов, если я просто говорю в своем собственном эхо-камере.

Пожалуйста, не ухудшайте проблему

Я не считаю, что обычные пользователи Parler заслуживают быть жертвами, называться фашистами или лишаться своей конфиденциальности. Я не собираюсь участвовать в чем-либо подобном.

Люди, совершившие преступления, должны быть рассмотрены как преступники. Однако на Parler было немало социопатических людей, которым нужно сочувствие и, возможно, психологическая помощь, а не дальнейшее провокационное воздействие. Я считаю, что нам нужно изучить, как технология позволила группе людей радикализовать друг друга и укрепить эхо-камеру, где могут процветать заговоры и расизм.

Отказ от ответственности: поскольку Parler никогда не применял свои Правила использования в отношении насилия, мне было все равно, игнорировать их Правила использования в отношении автоматического парсинга сайта.