Original size 1024x1536

Анализ меню Starbucks

PROTECT STATUS: not protected
7

В рамках данного проекта был проведён анализ меню сети кофеен Starbucks. Для анализа были использованы данные, содержащие информацию о различных продуктах меню, включая напитки и еду.

Анализ данных меню Starbucks представляет особый интерес, поскольку эта сеть является одной из крупнейших и наиболее популярных в мире. Понимание структуры ассортимента, ценовой политики и пищевой ценности продуктов может быть полезно как для самой компании, так и для потребителей, стремящихся сделать осознанный выбор. Кроме того, такие данные позволяют выявить тренды в предпочтениях клиентов, что актуально для маркетологов и исследователей рынка.

В рамках анализа данных из меню напитков Starbucks я решила использовать различные типы визуализаций, чтобы показать разные аспекты информации наиболее наглядно и понятно: 1. Круговая диаграмма (pie chart)  — Использована для отображения долей категорий напитков. Такой тип графика наглядно показывает, какие группы напитков представлены чаще, позволяя быстро оценить общее распределение. 2. Облако слов (word cloud)  — Построено на основе названий напитков. Это визуальный способ выявить самые часто встречающиеся слова, что помогает понять стилистику и акценты в наименованиях продукции Starbucks. 3. Горизонтальная столбчатая диаграмма (bar plot)  — Применена для сравнения среднего содержания кофеина в разных категориях напитков. Барплоты хорошо подходят для количественного сравнения между группами. 4. Точечная диаграмма (strip plot)  — Показывает, как распределяется уровень сахара в напитках внутри каждой категории. Мы выбрали этот вид визуализации, чтобы показать вариативность данных на индивидуальном уровне. 5. Violin plot (виолончель-диаграмма)  — Использован для анализа распределения калорий. Он объединяет плотность, медиану и разброс значений, делая его полезным для выявления отличий между категориями по «тяжести» напитков. Таким образом, каждая диаграмма была выбрана осознанно — для лучшего представления конкретной метрики и для разнообразия визуального восприятия.

big
Original size 1920x188
big
Original size 1920x487

фирменные цвета Starbucks, как часть визуальной айдентики бренда

big
Original size 1920x188

В этом коде производится анализ ассортимента напитков Starbucks с помощью круговой диаграммы. Сначала загружается и очищается датафрейм с меню, затем подсчитывается количество напитков в каждой категории. Далее эти данные визуализируются в виде круговой диаграммы, где каждая доля отображает процент напитков определённой категории. Пользовательские цвета, вдохновлённые фирменной палитрой бренда, подчёркивают связь визуализации с айдентикой Starbucks. Такой подход помогает наглядно представить структуру меню и выявить, какие категории напитков наиболее разнообразны.

Original size 1920x401
Original size 1920x1423

В этом коде создается визуализация — облако слов — на основе названий напитков из меню Starbucks. Сначала подключаются необходимые библиотеки: pandas для работы с таблицей данных, wordcloud для генерации облака слов, и matplotlib.pyplot для отображения графиков. Затем из CSV-файла загружается таблица с данными о напитках, и из названий столбцов удаляются лишние пробелы. Далее создается список пользовательских стоп-слов, которые не должны попадать в облако (например, предлоги, артикли и служебные слова), и он объединяется с базовыми стоп-словами библиотеки wordcloud. Из столбца «Beverage» собираются все названия напитков, пропуски удаляются, и данные преобразуются в одну строку, где слова разделены пробелами. Затем с помощью класса WordCloud генерируется облако слов с заданными параметрами: ширина, высота, белый фон, цветовая палитра «copper», ограничение до 100 слов, список стоп-слов и указание пути к шрифту. После этого создается изображение: рисуется облако слов, отключаются оси, задается заголовок, и финальная картинка отображается на экране.

Original size 1920x763
Original size 1920x1027

Следующим шагом проводится анализ данных о напитках Starbucks и создается визуализация, показывающая среднюю калорийность напитков по категориям. Сначала подключаются библиотеки pandas, matplotlib.pyplot и seaborn, необходимые для анализа и визуализации данных. Загружается CSV-файл с информацией о напитках, а затем удаляются лишние пробелы в названиях столбцов. Столбец с содержанием кофеина приводится к числовому типу данных, при этом все значения, которые не удалось преобразовать, заменяются на NaN.

Затем создается агрегированная таблица category_stats, в которой для каждой категории напитков рассчитываются средние значения по трем показателям: калории, сахар и кофеин. После этого данные сортируются по убыванию средней калорийности. Для визуализации задается стиль графика «whitegrid», затем создается пользовательская цветовая палитра: линейный градиент от коричневого (8c510a) к темно-зеленому (0B421A), где количество оттенков соответствует количеству категорий.

Далее строится горизонтальный столбчатый график (barplot), где по оси X откладывается средняя калорийность, а по оси Y — названия категорий напитков. Для каждого столбца применяется соответствующий цвет из созданной палитры. Графику задаются размеры, заголовок, подписи осей, и затем он отображается с помощью plt.show (). В результате получается визуально наглядное сравнение калорийности напитков по категориям.

Original size 1920x720
Original size 1920x1117

Этот код загружает данные о напитках Starbucks, очищает названия столбцов, преобразует значения кофеина в числовой формат и вычисляет среднее содержание кофеина для каждой категории напитков. Затем строится горизонтальный столбчатый график, отображающий среднее количество кофеина по категориям, с пользовательской цветовой палитрой и оформлением.

Original size 1920x498
Original size 1920x1146

Следующая визуализация используется для наглядного отображения 10 самых калорийных напитков Starbucks, чтобы сравнить их по содержанию калорий и узнать, какие напитки являются наиболее энергоемкими.

Original size 1920x526
Original size 1920x972

Эта визуализация используется для отображения распределения уровня сахара в напитках Starbucks по категориям. С её помощью можно увидеть, насколько сильно варьируется содержание сахара внутри каждой категории и выявить напитки с особенно высоким или низким уровнем сахара.

Original size 1920x558
Original size 1920x946

Следующий график помогает оценить, как соотносятся уровни сахара и кофеина в разных напитках Starbucks. С её помощью можно определить, есть ли связь между этими двумя показателями, а также выделить напитки с необычными сочетаниями — например, с высоким содержанием сахара, но низким уровнем кофеина, или наоборот.

Original size 1920x693
Original size 1920x1110

Эта визуализация используется для того, чтобы показать, как калорийность напитков распределяется внутри каждой категории. Она помогает увидеть не только средние значения, но и разброс, плотность и форму распределения — где калорий больше всего, как сильно варьируются значения, и есть ли выбросы. Такой график позволяет глубже понять, насколько разнообразны напитки внутри одной категории по энергетической ценности.

Original size 1920x548
Original size 1920x1027
Original size 1920x188

В ходе данного исследования был проведён всесторонний анализ ассортимента напитков Starbucks на основе расширенного меню, включающего информацию о калорийности, содержании сахара, кофеина и категории напитков. Основной целью анализа было выявить ключевые закономерности и особенности состава напитков, а также наглядно представить эти данные с помощью различных визуализаций. На первом этапе с помощью облака слов были выделены наиболее часто встречающиеся слова в названиях напитков, что позволило получить общее представление о продуктовой линейке бренда и акцентах в наименованиях. На следующем этапе были проанализированы средние значения калорийности, сахара и кофеина по категориям. Это позволило установить, какие группы напитков в среднем наиболее калорийны и какие содержат наибольшее количество кофеина — важная информация как для потребителей, следящих за своим рационом, так и для специалистов в области питания. Отдельное внимание было уделено сравнению напитков по содержанию кофеина: визуализация показала, что одни категории явно лидируют по этому показателю, тогда как другие почти не содержат кофеина. Это может помочь потребителям выбирать напитки в зависимости от желаемого уровня бодрости или ограничения по здоровью. Также было выделено топ-10 самых калорийных напитков — данный рейтинг особенно полезен для тех, кто старается контролировать потребление энергии, ведь некоторые напитки по калорийности могут соперничать с полноценным приёмом пищи. Анализ распределения сахара внутри категорий выявил широкий разброс значений: даже в одной группе напитков можно встретить как умеренно сладкие, так и чрезвычайно сахаросодержащие варианты. Это подчёркивает важность индивидуального подхода при выборе напитка. Особенно наглядной стала диаграмма рассеяния, показывающая соотношение сахара и кофеина в каждом напитке: она позволила легко обнаружить напитки с нестандартными сочетаниями, например, с высоким содержанием сахара, но низким уровнем кофеина, и наоборот. Наконец, распределение калорий по категориям с помощью виолончельных графиков (violin plots) позволило не только сравнить средние значения, но и увидеть характер распределения — плотность, выбросы и вариативность внутри групп.

Общий вывод: напитки Starbucks отличаются значительной вариативностью по калорийности, содержанию сахара и кофеина как между категориями, так и внутри них. Это подчёркивает необходимость осознанного выбора со стороны потребителя, особенно если важны такие факторы, как здоровье, диета или уровень потребляемого кофеина. Визуализации, использованные в исследовании, сделали сложные числовые данные наглядными и доступными для интерпретации, а также выявили скрытые закономерности в структуре ассортимента напитков.

Original size 1920x188

для обложки использовался Recraft, стиль: Photorealism, промпт: starbucks drink menu analysis https://www.recraft.ai/

Анализ меню Starbucks
7
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more