
Вводная часть
Идея визуализации цифр фильмографии Netflix была связана с тем, что я искренне интересуюсь развитием массового кино, которым и занимается компания. Так как индустрия претерпела некоторые изменения в последние годы, мне было крайне любопытно изучить доходы, оценки, бюджеты и в целом посмотреть на графиках тренды развития и выявить те или иные зависимости.
Базу данных я нашел в отрытом доступе на Kaggle. Предпросмотр показал, что данный файл позволит максимально полно раскрыть интересующую меня тему.
Типы графиков:
1. Точечная диаграмма Данный график позволит посмотреть количественный тренд и увидеть индивидуальные случаи (отклонения)
2. Гистограмма С помощью гистрограммы можно будет увидеть динамику объема и выявить общий тренд на определенных отрезках времени
3. Горизонтальная столбчатая диаграмма Этот тип позволит составить таблицу лидеров в разных показателях (я с его помощью выстрою список популярных жанров)
4. Линейный график График даст возможность взглянуть на общий тренд от года к году, с видимыми точками экстремума на отрезке времени
Этапы работы
Для начала я импортировал базовые библиотеки:
• pandas — для работы с данными, загрузки и обработки CSV-файлов • matplotlib — для построения различных графиков и визуализации данных • matplotlib.font_manager — для подключения пользовательского шрифта • seaborn — для создания статистических графиков и визуализации данных с улучшенным дизайном и минимальным кодом, упрощения анализа распределений, корреляций и группировок данных.

Далее я добавляю шрифт, который хочу использовать в проекте и подключаю базу данных, которую скачал ранее. А также для удобного экспорта сразу выставляю dpi на 300 пунктов.
Визуальный стиль был выбран как константа визуала хостинга — черный и красные цвета с строгими линиями. Также для большей стилизации был добавлен шум поверх графиков, что позволило добавить им эффект бумаги, который часто встречается на постерах работ Netflix.
Визуализация
График 1
Для начала мне было интересно посмотреть на зависимость рейтинга от популярности, так как в последнее время можно заметить, что действительно кассовые и популярные картины оказываются довольно средними и оценка оказывается ниже ожидаемой
Микро-вывод:
Как оказалось, чем выше популярность выше, тем ближе он находится к средней оценке и обычно не пересекает границу оценки 8, оставаясь в категории хороших, но не отличных фильмов
График 2
Для меня было интересно посмотреть на зависимость дохода от бюджета, так как я считал, что на Netflix очень часто окупаются те картины, на реализацию которых не было вложено много средств (пилотные сезоны, например). Я думал, что при среднем вкладе в бюджет на хостинге создатель может увидеть прибыль на высоких показателях
Микро-вывод:
Да, такие работы действительно есть, они находятся в левой части графика, а также в середине, но это скорее очень редкое исключение из правил. Целевой тренд в том, что есть прямая зависимость от вложенных денег и полученной прибыли на проект.
График 3
Я считал, что на хостинге преимущественно больше оценки 6-7, так как те культовые картины, которые доходят до нас — это далеко не постоянное явление. А значит ждать исключительно высоких оценок не стоит
Микро-вывод:
Гипотеза подтвердилась и на хостинге действительно большая часть работ находится в рейтинговой группе 6-7, лишь малая доля добирается до 8-9, а именно ~350 работ в сравнении с ~2300 в группе описанной ранее.
А вот работ с очень низкими оценками практически нету — хостинг крайне тщательно отбирает контент.
График 4
Как мне казалось, наиболее популярным жанром можно выделить триллер, а после него комедии и приключенческие. Для визуализации была выбрана горизонтальная столбчатая диаграмма, чтобы посмотреть наглядно первое, второе и третье место в списке популярных жанров на хостинге
Микро-вывод:
Как оказалось, наибольший интерес для пользователей составил жанр драмы, а после него можно увидеть комедию и триллер. Приключение, в свою очередь, заняло 7-е место в списке, на мое удивление
График 5
Моя гипотеза была в том, что золотым годом стал 2020, ведь тогда все были дома и это должно было поспособствовать просмотру картин на подобных хостингах.
Микро-вывод:
В 2020 году произошло резкое снижение доходов с картин, а на данный момент точно также происходит в наши дни после подъема между 2020 и 2025. Как можно увидеть, к показателям до пандемии не подобрались и близко
Заключение
После изучения показателей хостинга, для меня немного по-другому выглядит индустрия на данный момент.
Оказывается, что большая часть высокобюджетных картин не стремится к получению высокой оценки и выведению культурной ценности, всё стремится к коммерции. Доходы падают в сравнении с показателями до пандемии и пока что не находятся и близко к прежним. Популярность не гарантирует получение высокой оценки от зрителей, гораздо чаще выходит средний показатель удовлетворенности пользователей хостинга. Также есть четкая зависимость между бюджетом и доходом у фильмов.
Диск с файлами: https://disk.yandex.ru/d/W37mSI5a0EJIUQ