
Концепция
На сайте kaggle.com я решила найти данные по играм, так как изредка, в свободное время, играю во что-нибудь сюжетное. И среди предложенных результатов выбрала игры в магазине Steam. Было интересно изучить подобное.
В качестве цветового решения для диаграмм я проанализировала игры и заметила тенденцию выведения на роль главных героев женских персонажей. Плюс, в играх в последнее время превалируют неоновые цвета и упор сделан на оружии и агрессии, поэтому графики в оттенках красной цветовой палитры.

Для выбора шрифта я обратилась к chatgpt, часть вариантом не отличались друг от друга и были почти одинаковыми. Но один из них мне понравился и выглядит стабильно и уравновешенно.
В работе были созданы такие типы графиков, как:
- > Круговая диаграмма - > Горизонтальная диаграмма - > Столбчатая горизонтальная диаграмма - > Гистограмма вертикальная - > Корреляционная матрица - > Точечная диаграмма
Типы графиков выбраны, чтобы более точно передать и визуализировать результат анализа информации из датасета.
Обработка данных
Перед началом работы над анализом данных и построением графиков я добавила нужные для работы программы библиотеки — pandas, matplotlib, seaborn. А также объект из библиотеки matplotlib — rcParams, который позволяет задавать стиль, шрифты, размеры для всех графиков в коде. После поискала подходящую палитру из имеющихся в программе и добавила выбранный csv файл, считав с него данные.
Визуализация данных
Популярность жанров игр
Вывод: На горизонтальной гистограмме можно увидеть популярность жанров игр. Среди которых на первом месте — экшен игры, а на последнем — еще тестируемые игры.
Соответствие года выпуска игр и цен
Вывод: На точечной диаграмме можно увидеть связь между ценой игр и их годом выпуска. Точки представляют годы выпуска отдельных игр, а розовая линия показывает средний год выпуска для игр в определенном ценовом диапазоне. Глядя на график, можно заметить, что более дорогие игры, выпущены в последние годы, что указывает на тенденцию повышения цен на новые игры.
Распределение популярных годов выпуска игр
Вывод: На круговой диаграмме можно увидеть распределение положительных оценок игр по пяти самым популярным годам выпуска. Наибольшую долю занимают игры, выпущенные в 2012 год, тогда как наименьшая доля приходится на 2016. Проценты помогают увидеть, сколько положительных оценок было получено в каждом году относительно общего числа положительных оценок за эти годы.
Наиболее популярные платформы для игр
Вывод: На вертикальной столбчатой диаграмме можно увидеть количество игр на наиболее популярных платформах. Лидером является Windows, с наибольшим числом доступных игр, а на последнем месте из топ-10 находится Linux.
Корреляция между метриками
Вывод: На корреляционной матрице можно увидеть корреляцию между положительными и отрицательными рейтингами, временем, проведённым в игре, и ценой.
Наибольшая положительная корреляция — между положительными рейтингами и временем игры, что говорит о том, что более продолжительные игры чаще получают высокие оценки. В то же время корреляция между ценой и остальными параметрами остаётся низкой, что указывает на слабую связь между стоимостью игры и её популярностью или продолжительностью.
Описание применения генеративной модели
Для работы с данными я использовала ChatGPT. Он помог мне понять, как написать код, что и где нужно поменять, чтобы получить нужный результат и ответил на мои вопросы.