
Вводная часть
Данные и источник
Я использовала датасет Sleep Health and Lifestyle Dataset.
Формат данных — таблица с записями о людях: возраст, пол, профессия, длительность сна, субъективное качество сна, уровень стресса, физическая активность, количество шагов, пульс и наличие/тип расстройства сна.
Источник: открытый датасет с платформы открытых данных (Kaggle / open data-площадка).
Почему именно эти данные
Тема сна и стресса напрямую связана с повседневной жизнью и благополучием человека.
В датасете одновременно есть факторы образа жизни (активность, шаги, стресс) и показатели сна (длительность, качество, расстройства).
Такой набор позволяет не просто построить красивые графики, а проверить интуитивные гипотезы: — помогает ли физическая активность спать лучше; — насколько сильно стресс портит сон; — как связаны шаги, пульс и качество сна.
Какие виды графиков я выбрала и почему
Я использовала несколько типов визуализаций:
Гистограмма — чтобы показать распределение длительности сна в выборке и увидеть, где находится «норма».
Линейный график (среднее качество сна vs уровень активности) — чтобы показать, как качество сна меняется по группам активности, в динамике, а не одной цифрой.
Тепловая карта корреляций — чтобы одновременно показать все взаимосвязи между параметрами: сном, стрессом, активностью, шагами и пульсом.
Линейный график (качество сна vs уровень стресса) — чтобы отдельно подчеркнуть, как именно стресс влияет на сон, и сделать объясняющий график с ярко читаемым трендом.
Такая комбинация даёт и обзор распределений, и анализ связей, и наглядные объясняющие графики.
Этапы работы
Обработка данных (pandas)
1. Загрузка данных
2. Проверка
3. Работа с пропусками и категориями
Заполнила пропуски в столбце с расстройствами сна значением «без расстройств».
Создала категориальные группы по уровню активности и уровню стресса (очень низкий — очень высокий).
4. Агрегации и группировки
Считала среднее качество сна для разных уровней активности и стресса.
Собрала выборку числовых признаков для корреляционной матрицы.
Использование нейросетей
Я использовала генеративную модель ChatGPT (GPT-5.1): — для помощи в написании кода на Python / pandas / matplotlib; — для создания обложки проекта; — для подбора структуры и подписей к графикам.
Примеры запросов (промптов): — «Подскажи код для тепловой карты корреляций» — «Помоги сформулировать вывод по графику зависимости стресса и сна».
Стилизация графиков
Использовала библиотеки matplotlib и seaborn.
Задала единый шрифт IBM Plex Sans через matplotlib.font_manager, чтобы графики выглядели как единая инфографика.
Палитра — спокойные зелёные и мятные оттенки, ассоциирующиеся с медициной, здоровьем и мониторингом состояния.
Вдохновлялась визуальным языком медицинских дашбордов и научных журналов.
Статистические методы
Описание распределений — с помощью гистограммы посмотрела форму распределения длительности сна.
Средние значения по группам — groupby + mean () для анализа качества сна при разных уровнях активности и стресса.
Корреляционный анализ — использовала метод .corr () (корреляция Пирсона) для числовых параметров: длительность сна, качество сна, активность, стресс, шаги, пульс. — визуализировала матрицу корреляций через seaborn.heatmap.
Интерпретация корреляций — сильная отрицательная корреляция (около −0.8…−0.9) между стрессом и качеством/длительностью сна; — положительная корреляция между физической активностью и шагами, а также между активностью и качеством сна.
Итоговые графики
График 1 — Распределение длительности сна
Что показывает: Как наиболее часто распределены часы сна среди всех участников.
Вывод: — Большинство людей спят от 6.5 до 7.8 часов — Это близко к медицинским нормам — Крайние значения редки
График 2 — Влияние физической активности на качество сна
Что показывает: Рост качества сна по мере увеличения физической активности.
Вывод: — При высокой активности качество сна наиболее высокое — У малоподвижных участников сон хуже — Очень высокая активность даёт эффект, но немного ниже пика (перетрен?).
График 3 — Корреляции
Что показывает: Взаимосвязи между 6 ключевыми параметрами.
Главные выводы: — Сон и стресс имеют сильную отрицательную корреляцию (−0.81 / −0.90) — Качество сна растёт при увеличении активности — Пульс растёт при увеличении стресса — Количество шагов связано с уровнем активности (0.77)
График 4 — Качество сна и стресс
Что показывает: Чем выше стресс, тем хуже качество сна.
Вывод: — При низком стрессе качество сна максимально — После уровня стресса 6 начинается резкое ухудшение — На уровне 8 качество сна минимально
Общие выводы
Сон оказывается чувствителен и к позитивным факторам (физическая активность), и к негативным (стресс).
Умеренная и высокая активность связаны с лучшим качеством сна.
Стресс — главный негативный фактор: с ростом стресса сон становится короче и хуже по субъективной оценке.
Датасет позволяет сформулировать выводы, которые согласуются с общими медицинскими рекомендациями: больше движения, меньше стресса → лучше сон.
Код и данные
Блокнот с кодом (Google Colab): https://colab.research.google.com/drive/1t48FGRnjX7KLJlOmx02Gs2IlJLtAbqpb?usp=sharing
Датасет: https://drive.google.com/file/d/1_Hd4po4duPHH6urngXvkWjn3ZrX5xFFy/view?usp=sharing