Original size 1140x1600

Количество предварительно расследованных преступлений

PROTECT STATUS: not protected
6

Предварительно расследовано преступлений, совершенных лицами, ранее совершавшими преступления

Водная часть

Для своего исследования я выбрала данные о количестве предварительно расследованных преступлений, совершённых ранее судимыми лицами, в различных регионах и субъектах Российской Федерации. Источник информации — открытый портал crimestat.ru, данные представлены в формате XML.

Анализ такой статистики имеет практическую значимость — он может способствовать выработке эффективных решений со стороны органов государственной власти и правоохранительных структур.

В рамках анализа я визуализирую данные с помощью круговых и линейных диаграмм, чтобы сделать информацию более наглядной и доступной для восприятия.

Процесс работы

Сравнение преступности в субъектах РФ и федеральных округах на основе предварительно расследованных преступлений, совершённых ранее судимыми лицами

Шаг 1: Загрузить .xml файл в Colab

big
Original size 1398x140

Шаг 2: Прочитать XML-файл

big
Original size 831x86

Шаг 3: Посмотреть всех потомков indicatorData

big
Original size 853x92

Шаг 4: Посмотреть, что внутри одного подэлемента

big
Original size 979x114

После этого нам становится ясно, как устроены данные, каждая запись выглядит следующим образом: < row > < value >… < / value > < report_period_begin >… < / report_period_begin > < region_name >… < / region_name > < report_period_end >… < / report_period_end > < / row >

Шаг 5: Преобразуем XML в pandas DataFrame

Original size 1168x589

Шаг 6: Построим график

(1) Сравнение преступности в субъектах РФ и федеральных округах на основе предварительно расследованных преступлений, совершённых ранее судимыми лицами

Разделим все регионы на два типа:

  1. субъекты Российской Федерации (области, края, республики)

  2. федеральные округа (например, Приволжский ФО, Южный ФО и т. п.)

Затем сравним совокупное количество преступлений, совершённых ранее судимыми, в этих двух группах.

Шаг 1: Добавим столбец «Тип» (Субъект РФ или Федеральный округ)

Original size 754x49

Шаг 2: Суммируем значения по типу региона

Original size 833x189

Шаг 3: Рисуем диаграмму

Original size 950x164
Original size 650x527

(2) Топ-10 регионов с наибольшим ростом преступлений во втором полугодии

Сравним два периода:

  1. первое полугодие (например, до 01.07.2022)

  2. второе полугодие (например, до 01.12.2022)

И найдём регионы, где прирост был наибольшим.

Шаг 1: Загрузка и парсинг XML

Original size 1315x341

Шаг 2. Оставим только два периода

Original size 1086x120

Шаг 3. Преобразуем таблицу: строки — регионы, столбцы — периоды

Original size 1090x104

Шаг 4. Отберём топ-10 регионов по приросту

Original size 1117x246

Шаг 5. Построим столбчатую диаграмму

Original size 1203x182
Original size 1187x590

(3) Тепловая карта: Преступления ранее судимыми в топ-20 регионах РФ

Шаг 1: Загрузка и парсинг XML

Original size 1369x355

Шаг 2: Создадим сводную таблицу

Original size 1227x180

Шаг 3: Визуализируем — создадим тепловую карту

Original size 1246x213
Original size 1348x989

(4) Вариант графика: Линейная диаграмма динамики по федеральным округам

Покажем, как менялась динамика преступлений, совершённых ранее судимыми лицами, по федеральным округам за годы.

Шаг 1: Загрузка и парсинг XML

Original size 1349x400

Шаг 2: Отфильтруем только федеральные округа

Original size 815x56

Шаг 3: Сгруппируем по году и округу

Original size 884x57

Шаг 4: Преобразуем в таблицу для графика

Original size 931x53

Шаг 4: Построим линейный график

Original size 1232x213
Original size 802x469

(5) Диаграмма рассеяния: Преступность и её изменение по регионам

Покажем не только абсолютное число преступлений, но и насколько оно изменилось по сравнению с предыдущим периодом.

Шаг 1. Укажем путь к XML-файлу

Original size 1229x38

Шаг 2. Распарсим XML-файл и собери таблицу

Original size 1380x357

Шаг 3. Выделим данные за июль и декабрь 2022

Original size 1156x70

Шаг 4. Объединим и рассчитаем изменения

Original size 1251x54

Шаг 7. Построим scatter plot

Original size 1361x257
Original size 989x590
Количество предварительно расследованных преступлений
6
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more