Original size 840x1135

Анализ песен BTS

PROTECT STATUS: not protected
22

Концепция

BTS — южнокорейский группа, сформированная в 2013 году компанией Big Hit Entertainment. За последнее десятилетие они стали глобальным феноменом, объединив миллионы фанатов по всему миру. Их музыка, тексты и выступления не только задают тренды в индустрии, но и оказывают глубокое влияние на культуру, социальные вопросы и эмоциональное состояние слушателей.

Я являюсь фанаткой группы с 2019 года, поэтому исследование их музыки для меня — интересная и вдохновляющая тема.

big
Original size 1286x428

Данные я искала в Kaggle Для работы выбрала датасет BTS Lyrics and Spotify Data, в котором содержится различная информация о названиях и текстах песен BTS.

Для визуализации данных я выбрала следующие виды графиков:

Облако слов для частотности слов Гистограмма для продолжительности треков Круговая диаграмма для языков текстов Точечная диаграмма для танцевальности

Для работы был выбран фиолетовый — главный цвет фанатов BTS, ведь для них он имеет особую значимость.

big
Original size 2486x767

#cfadff

#b078ff

#925ae0

Обработка данных

Для начала работы с данными я загрузила датасет и распаковала его с помощью кода. Из-за ошибки с кодировкой я обратилась к нейросети DeepSeek. 1 Также он в ходе работы он подсказывал способы визуального изменения графиков, что позволило добиться единого стиля.


1 UnicodeDecodeError: 'utf-8' codec can’t decode byte 0xff in position 0: invalid start byte, напиши верный код

Original size 2486x1383

Далее создание единой палитры и карты, чтобы позже обращаться к ним и визуализировать графики в нужных цветах.

Original size 2259x435

После основных настроек можно приступить к непосредственно работе с графиками. Самым первым я выбрала облако слов. Перед этим создала пробный определитель топа 10 слов в английских текстах. 2 По нему также можно определить корректность облака слов.


2 Создай на основе данных из файла код для определения топ-10 слов в лирике

Original size 1789x777

Итоговые графики

Original size 4680x2512
Original size 2486x1160

Такой график показался мне самым удачным для работы с лирикой. Он хорошо визуализрует частоту слов в текстах песен. Основной посыл всего творчества BTS — любовь к себе, и получившееся облако слов это хорошо доказывает. Как можно заметить, среди самых часто-используемых: love, youre, im

В облаке использован шрифт Arial3 и уже созданная ранее палитра фиолетовых оттенков4.


3 Как поменять шрифт в заголовке и самом облаке. И как добавить отступ у заголовка. 4 Сделай, чтобы в облаке слов использовадись цвета из палитры purple_palette = ['#925ae0', '#b078ff', '#cfadff']

Original size 4896x2683
Original size 2261x1160

График продолжительности песен мне показалось интересным оформить гистограммой. Она напоминает звуковую волну, чаще люди ассоциируют форму звука с подобной формой. Гистограмма показывает распределение продолжительности треков в секундах.5 Высота каждого столбца гистограммы соответствует количеству треков, попадающих в определенный диапазон продолжительности. Соответственно можно заметить, что большее количество песен BTS длятся прмерно 200-250 секунд. Также мое внимание в графике привлек трек, длительность которого не превышает 50 секнд. Я решила специально поискать6 по базе что это, оказалось это трек из самого первого альбома Dark and Wild Interlude: What Are You Doing Now на 42 секунды.


5 На основе продолжительности всех треков создай график продолжительности треков в секундах. Сделай сетку тоньше и убери белую границу графика. Убери обводку. 6 Найди в базе самый короткий по длительности трек

В круговой диаграмме7 я решила показать соотношение текстов на корейском, английском и японском. Дело в том, что некоторые альбомы дублируются на два или три языка, таким образом одна и та же песня может исполняться на разных языках. В соотношении заметно, что корейский превалирует, за ним идет японский и только после 7% занимает английский.


7 Убери белую обводку, добавь цвета из палитры

Original size 4978x2709
Original size 1878x1185

В последнем графике показана «танцевальность» по годам от начала карьеры в 2013 и дальше. Что на самом деле я могу объяснить. В начале карьеры (2013-2014) BTS начинают больше как реп-группа, их песни зажигательные и яркие. 2015-2016 лирика сменяется на более депрессивную и посвящена непринятию себя, подростковым проблемам. На период 2017-2018 выпадают самые тяжелые времена для группы, однако в это же время создаются хиты. Лирика в эти годы очень чувственная, она писалась исходя из мыслей о распаде группы, BTS выходили на сцену, думая, что это их посление выступления. К концу 2018 и началу 2019 наступает расцвет. И тут для меня стало удивительным, что танцевальность в 2019 опускается до отметки уровня 2016 года. Ведь песни 2019 это обычно яркие песни о любви. В 2020 наступает коронавирус и все концерты отменяют, из-за чего BTS делают акцент на позитив в новых песнях, а в 2021 выходит самая танцевальная Permission to Dance, и посвящена она скорой отмене карантина и надежде на предстоящую встречу фанатов и группы. К 2022 песни стремятся повторить стиль истоков, а в 2023 группа приостанавливает выпуск общих альбомов, потому что участники уходят в армию.

Заключение

Исследование песен BTS помогло лучше узнать их дискографию. Хотя какие-то факты были для меня известны, некоторые стали открытием. Например график продолжительности треков помог мне узнать о самом коротком треке в альбомах, учитывая, что при поисковом запросе Яндекса или Google «самая короткая песня BTS», по какой-то причине такой трек вообще не находится. График танцевальности по годам было очень интересно рассматривать и анализировать, сопоставляя альбомы, вышедшие то или иное время. Круговая диаграмма вышла вполне ожидаемой, а облако слов было интересно создавать и подбирать варианты.

Материалы

Использованные нейросети:

DeepSeek для работы с кодом Leonardo ai генерация обложки Промпт: ARMY ocean BTS concert, purple

Датасет и блокнот Сылка

Источники изображений:

URL: https://pin.it/2CQ4FUTxD (дата обращения 17.03.2025) URL: https://pin.it/7xpvr88DL (дата обращения 17.03.2025) URL: https://www.yesasia.ru/wp-content/uploads/2020/02/%D0%91%D0%B5%D0%B7%D1%8B%D0%BC%D1%8F%D0%BD%D0%BD%D1%8B%D0%B9-40-700x468.jpg (дата обращения 17.03.2025)

We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more