Original size 1024x1536

Sleep & Lifestyle: визуальный анализ данных о сне и привычках

PROTECT STATUS: not protected
The project is taking part in the competition

Вводная часть

Данные и источник

Я использовала датасет Sleep Health and Lifestyle Dataset.

Формат данных — таблица с записями о людях: возраст, пол, профессия, длительность сна, субъективное качество сна, уровень стресса, физическая активность, количество шагов, пульс и наличие/тип расстройства сна.

Источник: открытый датасет с платформы открытых данных (Kaggle / open data-площадка).

Почему именно эти данные

Тема сна и стресса напрямую связана с повседневной жизнью и благополучием человека.

В датасете одновременно есть факторы образа жизни (активность, шаги, стресс) и показатели сна (длительность, качество, расстройства).

Такой набор позволяет не просто построить красивые графики, а проверить интуитивные гипотезы: — помогает ли физическая активность спать лучше; — насколько сильно стресс портит сон; — как связаны шаги, пульс и качество сна.

Какие виды графиков я выбрала и почему

Я использовала несколько типов визуализаций:

Гистограмма — чтобы показать распределение длительности сна в выборке и увидеть, где находится «норма».

Линейный график (среднее качество сна vs уровень активности) — чтобы показать, как качество сна меняется по группам активности, в динамике, а не одной цифрой.

Тепловая карта корреляций — чтобы одновременно показать все взаимосвязи между параметрами: сном, стрессом, активностью, шагами и пульсом.

Линейный график (качество сна vs уровень стресса) — чтобы отдельно подчеркнуть, как именно стресс влияет на сон, и сделать объясняющий график с ярко читаемым трендом.

Такая комбинация даёт и обзор распределений, и анализ связей, и наглядные объясняющие графики.

Этапы работы

Обработка данных (pandas)

1. Загрузка данных

Original size 2190x660
Original size 2174x290

2. Проверка

Original size 2182x934

3. Работа с пропусками и категориями

Заполнила пропуски в столбце с расстройствами сна значением «без расстройств».

Создала категориальные группы по уровню активности и уровню стресса (очень низкий — очень высокий).

4. Агрегации и группировки

Считала среднее качество сна для разных уровней активности и стресса.

Собрала выборку числовых признаков для корреляционной матрицы.

Использование нейросетей

Я использовала генеративную модель ChatGPT (GPT-5.1): — для помощи в написании кода на Python / pandas / matplotlib; — для создания обложки проекта; — для подбора структуры и подписей к графикам.

Примеры запросов (промптов): — «Подскажи код для тепловой карты корреляций» — «Помоги сформулировать вывод по графику зависимости стресса и сна».

Стилизация графиков

Использовала библиотеки matplotlib и seaborn.

Задала единый шрифт IBM Plex Sans через matplotlib.font_manager, чтобы графики выглядели как единая инфографика.

Палитра — спокойные зелёные и мятные оттенки, ассоциирующиеся с медициной, здоровьем и мониторингом состояния.

Вдохновлялась визуальным языком медицинских дашбордов и научных журналов.

Статистические методы

Описание распределений — с помощью гистограммы посмотрела форму распределения длительности сна.

Средние значения по группам — groupby + mean () для анализа качества сна при разных уровнях активности и стресса.

Корреляционный анализ — использовала метод .corr () (корреляция Пирсона) для числовых параметров: длительность сна, качество сна, активность, стресс, шаги, пульс. — визуализировала матрицу корреляций через seaborn.heatmap.

Интерпретация корреляций — сильная отрицательная корреляция (около −0.8…−0.9) между стрессом и качеством/длительностью сна; — положительная корреляция между физической активностью и шагами, а также между активностью и качеством сна.

Итоговые графики

График 1 — Распределение длительности сна

Что показывает: Как наиболее часто распределены часы сна среди всех участников.

Вывод: — Большинство людей спят от 6.5 до 7.8 часов — Это близко к медицинским нормам — Крайние значения редки

Original size 2184x790
Original size 771x564

График 2 — Влияние физической активности на качество сна

Что показывает: Рост качества сна по мере увеличения физической активности.

Вывод: — При высокой активности качество сна наиболее высокое — У малоподвижных участников сон хуже — Очень высокая активность даёт эффект, но немного ниже пика (перетрен?).

Original size 2166x1086
Original size 785x567

График 3 — Корреляции

Что показывает: Взаимосвязи между 6 ключевыми параметрами.

Главные выводы: — Сон и стресс имеют сильную отрицательную корреляцию (−0.81 / −0.90) — Качество сна растёт при увеличении активности — Пульс растёт при увеличении стресса — Количество шагов связано с уровнем активности (0.77)

Original size 2172x1146
Original size 2176x686
Original size 893x724

График 4 — Качество сна и стресс

Что показывает: Чем выше стресс, тем хуже качество сна.

Вывод: — При низком стрессе качество сна максимально — После уровня стресса 6 начинается резкое ухудшение — На уровне 8 качество сна минимально

Original size 2168x1280
Original size 778x558

Общие выводы

Сон оказывается чувствителен и к позитивным факторам (физическая активность), и к негативным (стресс).

Умеренная и высокая активность связаны с лучшим качеством сна.

Стресс — главный негативный фактор: с ростом стресса сон становится короче и хуже по субъективной оценке.

Датасет позволяет сформулировать выводы, которые согласуются с общими медицинскими рекомендациями: больше движения, меньше стресса → лучше сон.

Код и данные

Sleep & Lifestyle: визуальный анализ данных о сне и привычках
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more