
описание
В этом проекте проанализирован датасет о продажах шоколада в различных странах мира. Этот анализ помог узнать, как меняются объемы продаж в течение года, какая зависимость существует между количеством отгруженных коробок и выручкой продавцов, и в каких странах наблюдается наибольший спрос на шоколадную продукцию.
Исследование позволило выявить сезонные тренды в продажах шоколада, определить наиболее востребованные продукты и установить ценовую политику различных видов шоколада
Внешний вид графиков и стиль проекта в целом вдохновлен оттенками и текстурами шоколада — от темного горького до молочного и белого.

В исследовании использованы данные о продажах шоколада c kaggle.com. Датасет содержит информацию для каждой продажи о том, в какой стране она совершена, кто был продавцом, какой продукт продан, дату сделки, сумму продажи и количество отгруженных коробок. Для анализа применены такие данные, как общий объем продаж по странам, популярность продуктов, сезонность продаж по месяцам, эффективность продавцов и цена за коробку различных видов шоколада.
Данные представлены в виде столбчатых диаграмм с разным масштабом, чтобы наглядно показать разницу в продажах между странами и продуктами, линейной диаграммы для отображения сезонности в течение года, диаграммы рассеяния для визуализации эффективности продавцов, стековой гистограммы для анализа квартальных трендов и радарной диаграммы для сравнения цен на различные виды шоколадной продукции.
этапы

Исследование и очистка данных

Анализ по странам
Анализ популярности продуктов
Анализ сезонности продаж
Анализ эффективности продавцов
Стилизация визуализаций
01
01
Первый график представляет собой столбчатую диаграмму, которая показывает общий объем продаж шоколада в разных странах. Он демонстрирует, в каких странах шоколадная продукция пользуется наибольшим спросом в денежном выражении.
01
Этот код сначала группирует данные по странам, суммируя значения продаж и количество отгруженных коробок для каждой страны. Затем сортирует результаты по объему продаж и создает столбчатую диаграмму.
02
02
Второй график представляет собой горизонтальную гистограмму, которая визуализирует 10 самых популярных видов шоколада по объему продаж. На графике продукты отсортированы по объему продаж в убывающем порядке, что позволяет моментально определить лидеров продаж.
02
Здесь код группирует данные по продуктам, вычисляет сумму продаж, количество отгруженных коробок и количество заказов для каждого продукта. Затем рассчитывает среднюю цену за коробку и выбирает топ-10 продуктов с наибольшими продажами.
03
03
Третий график представляет собой линейную диаграмму с двумя осями Y, которая демонстрирует сезонные тренды в продажах шоколада на протяжении года. Эта визуализация позволяет отследить, как меняются объемы продаж и количество отгруженных коробок в разные месяцы.
03
Этот код группирует данные по месяцам, вычисляет сумму продаж и количество отгруженных коробок для каждого месяца. Затем выполняется сортировка по номеру месяца для правильного хронологического отображения. Создается график с двумя осями Y: основная для объема продаж и дополнительная для количества коробок.
04
04
Четвертый график представляет собой диаграмму рассеяния (scatter plot), которая визуализирует эффективность лучших продавцов шоколада. Эта диаграмма многомерна: она одновременно отображает три ключевых показателя для каждого продавца. На графике каждый продавец представлен точкой, где:
-Положение по оси X соответствует общему объему продаж в долларах -Положение по оси Y показывает количество отгруженных коробок
Такой формат визуализации позволяет сразу увидеть не только лидеров по объему продаж, но и оценить их эффективность: некоторые продавцы могут иметь высокий объем продаж при относительно небольшом количестве отгруженных коробок, что говорит о продаже более дорогих продуктов.
04
Код группирует данные по продавцам, рассчитывает общую сумму продаж, количество отгруженных коробок и количество заказов для каждого. Затем вычисляется средняя стоимость одного заказа и выбираются топ-10 продавцов с наибольшими продажами. Создается диаграмма рассеяния, где размер каждой точки пропорционален количеству заказов, а цвет задается в градиенте шоколадной палитры
05
05
Пятый график представляет собой стековую гистограмму, которая демонстрирует распределение продаж шоколада по кварталам с разбивкой по странам. Эта визуализация позволяет не только увидеть квартальную динамику общих продаж, но и оценить вклад каждой страны в разные периоды года.
Анализ графика показывает, как меняется структура продаж в течение года. Например, можно увидеть, что в первом квартале (Q1) лидером продаж является Австралия, в то время как во втором квартале (Q2) на первое место выходит Великобритания. Также заметно общее снижение объема продаж к третьему кварталу (Q3) почти для всех стран, что может указывать на сезонность спроса на шоколадную продукцию.
05
Этот код группирует данные по кварталам и странам, суммируя объемы продаж и количество отгруженных коробок. Затем создается сводная таблица, где индексами являются кварталы, столбцами — страны, а значениями — суммы продаж.
06
06
Шестой график представляет собой радарную диаграмму, которая сравнивает стоимость различных видов шоколада в расчете на одну коробку.
На графике каждый вид шоколада расположен на своей оси, расходящейся из центра. Расстояние от центра до точки на оси соответствует цене за коробку данного продукта в долларах. Точки на осях соединены линией, образуя многоугольник, а область внутри многоугольника заполнена светло-коричневым цветом, что соответствует общей шоколадной теме визуализации.
График показывает 8 видов шоколада с самой высокой ценой за коробку. Это позволяет легко определить премиальные продукты и сравнить соотношение их цен.
06
Этот код группирует данные по продуктам и рассчитывает среднюю цену за коробку, деля общую сумму продаж на количество отгруженных коробок. Затем выбираются 8 продуктов с самой высокой ценой за коробку.
выводы
Исследование продаж шоколада демонстрирует лидерство Австралии ($1,14 млн) на рынке, с Великобританией и Индией на втором и третьем местах ($1,05 млн каждая). Наиболее востребованные продукты — «Smooth Sliky Salty», «50% Dark Bites» и «White Choc», генерирующие продажи от $329 до $350 тысяч. Выявлена чёткая сезонность с пиками в январе ($896 тыс) и июне ($865 тыс) и спадом в апреле ($674 тыс). Квартальная динамика показывает, что в первом квартале доминирует Австралия, во втором — Великобритания, а к третьему наблюдается общее снижение продаж. Среди продавцов заметны различные стратегии: одни фокусируются на дорогих продуктах, другие — на увеличении объёма. Ценовой анализ выявил, что самые дорогие продукты («Almond Choco», «White Choc» и «Smooth Sliky Salty») также входят в число лидеров продаж, что указывает на востребованность премиального сегмента.
описание применения генеративной модели
Для работы были использованы изображения, сгенерированные в Midjourney, чтобы подобрать референсы и проиллюстрировать тему исследования.
Промпты: A close-up of dark chocolate chunks, with some slightly melted and others still in their original state, scattered on top of the pile. Dark chocolate chips lying on plane background. Chocolate shavings slightly melted on top of the pile. Different color chocolate bars on top of each other with nuts on top of them.
Ссылка на модель: https://www.midjourney.com