Сетевая визуализация освещения в СМИ насилия в отношении женщин в Бангладеш

Я только что закончил свой первый проект по визуализации сети на Python и Gephi на основе данных известной газеты Бангладеш «Dhaka Tribune». Визуализация основана на взаимосвязи совпадения между объектами, такими как местоположение, организации и люди, цитируемые в новостных статьях в Dhaka Tribune за 2012–2016 годы.

Мы хотели изучить освещение в СМИ статей о домогательствах или насилии в отношении женщин, включая дела, связанные с изнасилованиями и убийствами. Этот проект был реализован с помощью KolpoKoushol, инициативы бывших выпускников Массачусетского технологического института в Бангладеш, чтобы собрать людей из разных областей для изучения междисциплинарных проектов и создания прототипов некоторых из наших собственных. Наш наставник, Сайед Арефинул Хак, помогал нам извлекать данные из новостей и руководил нами на протяжении всего проекта.

Методология:

  1. Данные были собраны при сканировании Dhaka Tribune Арефинулом Хаком. Используя Stanford NER Tagger, были извлечены уникальные сущности: местоположение, организации и лица. Всего найдено 49055 статей.
  2. Набор данных новостей был в формате JSON. Каждая новостная статья имеет следующие атрибуты: news_crawled_date, news_ml_tags, газета_url, news_url, news_headline, news_reporters ’, news_original_tags, news_text, news_ner_tags, news_publish_date, news_naive_tags, news_image_urls, news_gative.
  3. Я отфильтровал данные на основе определенных ключевых слов, таких как изнасилование / групповое изнасилование, сексуальное насилие, жертва с применением кислоты. Полный список ключевых слов можно найти в связанной записной книжке.
  4. В атрибуте news_ner_tags Stanford NER Tagger сгенерировал Местоположение, Лица и Организации были отфильтрованы по их уникальным значениям.
  5. Мы сгенерировали сеть из отфильтрованного набора данных. Места, лица и организации использовались в качестве узлов для сети, в то время как их совместное появление в конкретной новостной статье было преимуществом. Для каждой новостной статьи мы сгенерировали полный график совместной встречаемости этих узлов.
  6. После перебора более 607 отфильтрованных статей мы нашли всю сеть вместе с важными объектами, общие организации, работающие над темами, связанными с домогательствами, такие как различные медицинские колледжи, которые работали над помощью жертвам, полицейские и криминальные группы Бангладеш, другие организации, которые работали вместе с Верховный суд BDR, конкретные места, которые широко освещались, такие как Дакка и Читтгонг, небольшие группы событий, которые не получали большого освещения.
  7. Мы использовали NetworkX для генерации сети. Затем мы экспортировали сеть с 2777 узлами и 21793 ребрами в Gephi и визуализировали ее. Мы заметили, что у слов Dhaka Tribune и Bangladesh непропорционально большое количество граней, и зная, что они не помогают пониманию, мы удалили эти термины. Однако мы сохранили термин Дакка, чтобы показать, что когда мы находимся в Дакке, большая часть освещения посвящена именно этому. Места из сельской местности просто не привлекают внимания.
  8. Код можно найти здесь, но я сохранил только ключевые части скриптов, а не исследовательские части для воспроизведения.

Визуализация:

Вот снимок визуализации:

Интерактивную версию можно найти здесь:

Освещение в СМИ насилия в отношении женщин в Бангладеш

Особенности :

  1. Сеть была окрашена в соответствии с классом модульности, и я также выделил концентраторы. Интересно, что кластеры, как правило, выделяли разные и очень конкретные случаи. Например, зеленая группа слева в основном связана с гибелью девушки по имени Фелани сотрудниками пограничной полиции Индии. Фелани Хатун, 15-летняя бангладешская девочка, была застреляна индийскими Силами безопасности границы (BSF) 7 января 2011 года на границе Индия - Бангладеш. [1] [2] Фотография трупа Фелани Хатун, висящего на заграждении из колючей проволоки, была обнаружена международными СМИ, и публикация этих фотографий вызвала международную озабоченность. [3]. Вот отрывок из сети о Фелани, который всегда был очень популярным делом.

2. Точно так же другое дело об изнасиловании и убийстве Тону, которое недавно было также очень популярно в СМИ, было выделено фиолетовым цветом. Ее дело до сих пор остается нераскрытым, поскольку полиции не удалось найти убийц.

3. Этот кластер соответствует спору о игроке в крикет по имени Рубель Хоссейн, которого Назнин Актер Хэппи обвинил в изнасиловании. (хотя позже обвинение было снято), но мы видим, что в этом деле было сотрудничество со многими организациями.

4. Это самая интересная сеть людей в Джамаат-и-Ислами. Некоторым из людей могли быть предъявлены обвинения в преступлениях против женщин в освещаемых новостях, поскольку группа очень плотная, но некоторые из доброкачественных организаций, такие как больница Ибн-Сина, также здесь. Вот некоторые люди и организации, с которыми связан Мотиур Рахман Низами, которые недавно были осуждены и приговорены к смертной казни за военные преступления.

5. Дакка казалась самым важным центром освещения событий. В Дакке есть штаб-квартиры важных организаций, таких как CID, RAB, которые часто расследуют случаи насилия в отношении женщин, а также Верховный суд, полиция в целом и медицинские колледжи. События в Дакке освещались больше, потому что о них «сообщалось» больше, в то время как другие серые группы вокруг были в основном занижены. У меня нет точной статистики изнасилований / насилия в Дакке и других регионах, поэтому я не могу провести точное сравнение. А сеть на самом деле изображает «совместное возникновение» сущностей, и это, вероятно, громкое дело привлечет много внимания СМИ и организаций Дакки. Пока я не уверен, следует ли мне делать отсюда какие-либо выводы или нет, но я ошибаюсь в том, что отношусь к этому скептически.

Итак, я думаю, что осознание того, что многие узлы сети являются жертвами, было для меня очень травматичным. Сохаги Джахан Тону, Фелани имеют непропорциональное освещение, и они были жестоко убиты, но есть много мелких случаев, таких как Аклима, Липи, Парвин, Шилпа, Антара, кое-где в сети, которая имеет очень маленькие скопления, в основном окрашенные в серый цвет.

Я сочувствую им, поскольку небольшие случаи, кажется, в основном забыты и не замечаются средствами массовой информации, и внезапно я смотрю на сеть преступлений и связанные с ними организации, которые спасали их в некоторых случаях (например, больницы) и связанных с ними людей (которые могут быть как нападавшие, так и полиция) и местоположение были для меня совершенно другим опытом.

Здесь наставники посоветовали мне выйти из зоны комфорта, и я не ожидал, что проект визуализации сети окажется таким успешным, однако я рад, что это получилось, и надеюсь, что люди также «почувствуют» жертвы после просмотра сети.