Original size 840x1264

Анализ к-поп индустрии

PROTECT STATUS: not protected
6

С каждым годом индустрия к-попа становится все популярнее в нашей стране: подростки слушают музыку, смотрят клипы и рекламу любимых певцов и танцоров. Тысячи молодых людей и девушек ежегодно проходят прослушивания, но лишь единицы из них дебютирую в составе групп. Я решила разобраться, есть ли закономерность во внешних обстоятельствах дебюта — родном городе, росте, возрасте потенциального айдола, а также в том, в какой компании больше шансов на дебют по половому признаку.

Краткая информация

Датасет я нашла на сайте kaggle.com, выбрала его среди схожих за больший объем данных и меньшее количество пустых строк.

Типы диаграмм, которые я использовала в своей работе:

(01) столбчатая диаграмма (02) точечная диаграмма (03) круговая диаграмма (04) диаграмма в формате карты мира (05) облако слов

Эти диаграммы я подбирала по смыслу к каждой из рассматриваемых категорий. На мой взгляд, именно так наиболее понятны зависимости.

Цвета

Очень многие диаграммы моего проекта делятся на две части по половой принадлежности айдолов, поэтому за основу кодировки пола я взяла розовый и голубо-зеленый цвета, а также добавила темный фон, так как на темном диаграммы выглядят интереснее. Следовательно, подписи стали белыми на контрасте с фоном.

Графики

big
Original size 836x545

Этот код создает и стилизует гистограмму с кривыми плотности для сравнения распределения роста между парнями и девушками айдолами, а затем сохраняет полученный график в PNG-файл. Единая стилистика — светлые подписи, розовый и зеленый в оформлении относящихся к парням и девушкам данным и темный фон.

Код во второй части слайдера также задает общую стилистику всем графикам: размеры и цвета подписям и тд.

0
Original size 1356x620

Код отображает кастомную настройку интерактивной карты, которая показывает количество айдолов из разных стран. При наведении на определенную закрашенную страну вылезает плашка, сообщающая название страны и кол-во айдолов из нее. Я вручную настраивала цвета закрашивания и карты, а также диапазон отображения кол-ва айдолов для более четкой картины.

Original size 1900x1526
0

Графики соотношения пола в пяти самых популярных компаниях

Эти круговые диаграммы показывают соотношение парней и девушек в 5 самых популярных компаниях (агентствах). В коде использован цикл, позволивший создать все 5 диаграмм сразу.

Во второй картинке в слайдере заложена функция, задающая параметры для круговых диаграмм (цвета, размер, положение текста и прочее).

0
Original size 852x546

Точечный график соотношения года рождения и года дебюта показывает, по сути, в каком возрасте айдолы дебютируют.

В рамках кода создается новое окно для графика, создается сам точечный график, где каждая точка представляет одного айдола. Используется функция create_styled_plot для применения общего стиля (заголовок, метки осей, цвет осей, сетка) к графику.

Original size 1902x596
Original size 794x451

Помимо информации о странах происхождения айдолов, мне показалась интересной статистика и по родным городам, которые я решила представить в форме облака слов.

Функция create_styled_wordcloud (text, title, color) работает со стилем этого графика, а также генерирует облако слов на основе текста с помощью .generate (text).

Для дальнейшей работы с таблицей, я объединяю все города в одну строку с разделителем-пробелом, а затем функция облака слов из этой строки делает сам график. Изначально я хотела убрать информацию об отсутствующих городах из таблицы (NAN), но в итоге оставила, так как это тоже показательное значение для дальнейшего анализа.

Original size 2048x1154

Дополнительные части кода

Original size 906x596

Импорт необходимых данных

Original size 1732x484

Сохранение текущий график в PNG-файл с указанным именем.

Original size 1934x708

1. Загрузка датасета 2.Обработка отсутствующих значений в 'Debut' 3.Преобразование столбцов в datetime 4.Удаление ненужных столбцов

Краткий анализ

После того, как я проанализировала все графики, я поняла:

(01) Для дебюта очень важна страна. Не удивительно, но большая часть айдолов родом из Кореи

(02) Не очень важен город. Да, Сеул занимает крупный процент в облаке слов (ок. 12%), однако преобладает в нем же NAN — иной город или город точно не известен. Самое главное, чтобы город был в Корее, тогда процент успеха сильно выше.

(03) Рост важен как для парней, так и для девушек. Девушкам лучше быть не ниже 160 и не выше 168, а парням еще тяжелее — у большинства рост находится в диапазоне от 178 до 182.

(04) Дебютировать лучше в юном возрасте. Основная масса айдолов дебютирует примерно в 18-20 лет, хотя сейчас все чаще возраст дебюта снижается, и лишь изредка айдолы дебютируют позже 23-25. нужно понимать, что до дебюта есть еще период трейни: он длится от нескольких месяцев до нескольких лет (в отдельных случаях ожидание дебюта может занять 8-9 лет)

(05) Если вы девушка, лучше дебютировать в Starship, если парень — в SM. Эти компании имеют наибольший процент дебютировавших этого пола, а значит они умеют работать над продвижением групп такого пола, а также заинтересованы конкретно в них.

А вообще, все целиком и полностью зависит от желания человека и доли удачи. Представленные данные не только подтверждают, но и опровергают мой анализ, ведь айдолы рождаются не только в Корее, дебютируют не только в 20 лет, их рост может быть больше или меньше самых популярных значений, а компания может специализироваться на группах другого пола, однако все эти айдолы все еще остаются ими.

Используемые материалы:

Обложка сгенерирована Leonardo.ai

Для работы с кодом был использован чат гпт https://chatgptchatapp.com/ для поиска информации по графику-карте мира и облаку слов, а также для подбора цветовой гаммы проекта.

Анализ к-поп индустрии
6
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more