Original size 768x1024

Анализ данных кинофильмов

PROTECT STATUS: not protected
13

Описание

Данный проект представляет из себя анализ набора данных, взятых с сайта Kaggle.com и включающий список фильмов за период с 1920-е по 2020-е года.

Ссылка на базу данных Kaggle

Мне было интересно работать с данными киноискусства, так как я обучаюсь на анимации и довольно часто смотрю фильмы. Анализ кинокартин, позволяющих переживать различные чувства и окунающий в море эпох и культур, привлёк моё внимание.

big
Original size 1374x314

Получившиеся графики:

1. Распределение фильмов по годам выпуска. 2. Распределение жанров фильмов. 3. Связь между рейтингами IMDB и оценками на Metacritic. 4. Распределение рейтингов IMDB. 5. Влияние количества голосов на рейтинг IMDB. 6. Распределение кассовых сборов. 7. Изменение среднего рейтинга IMDB по годам выпуска. 8. Жанровое распределение по десятилетиям. 9. Распределение продолжительности фильмов.

Особенности графиков

Графики выполнены преимущественно в единой сине-голубой стилистике, что визуально объединяет их. Именно этот спокойный цвет у меня ассоциируется с вечером просмотра фильмов. Для анализа я использовала линейные графики, столбчатые диаграммы и гистограммы, которые обеспечивают лучшую сравнительную считываемость.

Этапы работы:

1. Выбор данных. 2. Загрузка данных из файла CSV в среду программирования. 3. Выбор интересующих столбцов. 4. Анализ данных. 5. Обработка и преобразование данных. 6. Визуализация данных с помощью различных типов графиков.

1. Распределение фильмов по годам выпуска

big
Original size 3508x715
Original size 1148x701

2. Распределение жанров фильмов

Original size 3508x640
Original size 1156x744

3. Связь между рейтингами IMDB и оценками на Metacritic

Original size 3508x680
Original size 1155x702

4. Распределение рейтингов IMDB

Original size 3508x862
Original size 1075x702

5. Влияние количества голосов на рейтинг IMDB

Original size 3508x723
Original size 1159x706

6. Распределение кассовых сборов

Original size 3508x545
Original size 1155x703

7. Изменение среднего рейтинга IMDB по годам выпуска

Original size 3508x696
Original size 1152x702

8. Жанровое распределение по десятилетиям

Original size 3508x1316
Original size 1334x788

9. Распределение продолжительности фильмов

Original size 3508x1327
Original size 1156x701

Описание применения генеративной модели

Обложка была сгенерирована нейросетью Leonardo.Ai в модели Diffusion XL. https://app.leonardo.ai/ai-generations

prompt:

Original size 1128x89

В процессе совершенствования инфографики, я обратилась за помощью к GPT-ChatBot, так как мне требовалось узнать устройство кода, который способствует созданию стилизации на диаграммах.

https://gpt-chatbot.ru/

Анализ данных кинофильмов
13
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more