Original size 1140x1600

Анализ данных преступности в России: 2003–2019 годы

PROTECT STATUS: not protected
4

Описание проекта

Для анализа я выбрала базу данных «Преступность в России: 2003–2019 годы», который представлен на сайте http://hubofdata.ru — негосударственный каталог всех открытых данных в Российской Федерации, пополняемый активистами. Эта тема интересна мне в связи популярностью жанра тру-крайм.

Для визуализации были использованы столбчатые диаграммы, тепловая карта, бокс-плот, диаграмма рассеяния.

Графики

Сначала нужно импортировать необходимые библиотеки, затем также подключиться к Google Drive, чтобы получить доступ к файлу. Далее происходит загрузка данных из CSV файла

big
Original size 787x328

Преобразовываем некоторые столбцы для удобства работы с данными — в столбце «Месяц» оставляем только месяц, год выводим в отдельный столбец.

big
Original size 783x187

Чтобы узнать количество преступлений по годам, а не месяцам, группируем данные по каждому году отдельно.

Затем устанавливается стиль графиков, который будет использован и в дельнейшем. Фон графиков черный, а цвет столбца в зависимости от Количества преступлений варьируется от белого до красного.

big
Original size 1050x563
Original size 1489x790

Для создания графиков по конкретным категориям преступлений создадим список categories и с помощью цикла for происходит генерация подграфиков для каждой категории преступлений. Насыщенность цвета линий и точек каждого графика также зависит от количества преступлений.

Original size 1080x218
Original size 1167x707
Original size 1990x1474

Для создания столбчатой диаграммы с разбивкой по категориям преступлений за каждый год сначала создается список с названиями категорий преступлений, которые необходимо отобразить на графике.

Original size 1287x542
Original size 1489x989

Далее можно создать график, который отображает показатели за конкретный год, который можно задать в переменной selected_year. Также добавляем зависимость насыщенности цвета от количества преступлений.

Original size 1097x452
Original size 1489x790

Проследить распределение преступлений по месяцам и годам наиболее наглядно можно с помощью тепловой карты. Это создает наиболее полную картину, где можно сравнить как каждый год между собой, так и каждый месяц внутри года.

Original size 1111x267
Original size 1374x790

Далее происходит визуализация данных о преступности в виде бокс-плота для анализа распределения количества преступлений по месяцам. На этом графике можно заметить, в какие месяцы статистически совершается больше преступлений.

Original size 1005x233
Original size 1489x790
Original size 993x322

С помощью диаграммы рассеяния можно провести анализ корреляции между двумя категориями преступлений — в данном случае изнасилованиями и убийствами.

Original size 1252x710

Обложка проекта сгенерирована с помощью нейросети Ideogram. Промт: a mysterious crime-related illustration

Анализ данных преступности в России: 2003–2019 годы
4
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more