
Описание проекта
Для анализа я выбрала базу данных «Преступность в России: 2003–2019 годы», который представлен на сайте http://hubofdata.ru — негосударственный каталог всех открытых данных в Российской Федерации, пополняемый активистами. Эта тема интересна мне в связи популярностью жанра тру-крайм.
Для визуализации были использованы столбчатые диаграммы, тепловая карта, бокс-плот, диаграмма рассеяния.
Графики
Сначала нужно импортировать необходимые библиотеки, затем также подключиться к Google Drive, чтобы получить доступ к файлу. Далее происходит загрузка данных из CSV файла

Преобразовываем некоторые столбцы для удобства работы с данными — в столбце «Месяц» оставляем только месяц, год выводим в отдельный столбец.

Чтобы узнать количество преступлений по годам, а не месяцам, группируем данные по каждому году отдельно.
Затем устанавливается стиль графиков, который будет использован и в дельнейшем. Фон графиков черный, а цвет столбца в зависимости от Количества преступлений варьируется от белого до красного.

Для создания графиков по конкретным категориям преступлений создадим список categories и с помощью цикла for происходит генерация подграфиков для каждой категории преступлений. Насыщенность цвета линий и точек каждого графика также зависит от количества преступлений.
Для создания столбчатой диаграммы с разбивкой по категориям преступлений за каждый год сначала создается список с названиями категорий преступлений, которые необходимо отобразить на графике.
Далее можно создать график, который отображает показатели за конкретный год, который можно задать в переменной selected_year. Также добавляем зависимость насыщенности цвета от количества преступлений.
Проследить распределение преступлений по месяцам и годам наиболее наглядно можно с помощью тепловой карты. Это создает наиболее полную картину, где можно сравнить как каждый год между собой, так и каждый месяц внутри года.
Далее происходит визуализация данных о преступности в виде бокс-плота для анализа распределения количества преступлений по месяцам. На этом графике можно заметить, в какие месяцы статистически совершается больше преступлений.
С помощью диаграммы рассеяния можно провести анализ корреляции между двумя категориями преступлений — в данном случае изнасилованиями и убийствами.
Обложка проекта сгенерирована с помощью нейросети Ideogram. Промт: a mysterious crime-related illustration