Original size 1024x1434

Анализ сердечных заболеваний

PROTECT STATUS: not protected
4
big
Original size 1477x739

О проекте

Для финального проекта по курсу я выбрала данные о сердечных заболеваниях, найденные на сайте Kaggle. Мне стало интересно проанализировать именно эти данные, потому что заболевания сердца — это одна из самых распространённых причин смерти в мире. Помимо этого, приведенная проблема затрагивает мою семью напрямую, а также многих из нас, кто потерял близких из-за внезапно случившего инфаркта. Я хотела посмотреть, какие факторы действительно оказывают влияние и можно ли с помощью данных предсказать риск. Анализ данных сердечных заболеваний поможет понять, на что стоит обращать внимание в первую очередь, чтобы снизить риски и жить дольше.

big
Original size 2049x1025

Для визуализации данных я выбрала две круговые диаграммы (показывает соотношение здоровых и больных, а также долю мужчин и женщин среди больных пациентов), гистограмму (отображает возрастное распределение пациентов), точечную диаграмму (демонстрирует связь возраста с максимальным пульсом) и тепловую карту (выявляет ключевые взаимосвязи между показателями). Каждый график помогает раскрыть разные аспекты сердечно-сосудистых заболеваний.

Палитра

big
Original size 2049x1025
Original size 1232x233

Для цветовой палитры проекта были использованы насыщенные оттенки, подобранные с помощью Adobe Color, отражающие медицинскую тематику: глубокий бордовый (D9435F) и нежный розовый (F27983) символизируют сердце и кровеносную систему, темно-бирюзовый (075959) добавляет акцент профессиональной достоверности, а приглушенный пыльно-розовый (D99191) смягчает композицию, создавая баланс между эмоциональным воздействием и клинической точностью. Такая гамма визуально связывает проект с темой кардиологии и подчеркивает важность здоровья сердца.

Обработка данных

Первым делом я импортировала необходимые библиотеки: pandas для работы с данными, matplotlib.pyplot и seaborn для построения графиков, а также numpy для математических операций.

Затем я загрузила датасет heart.csv, который содержит данные о пациентах и их сердечных показателях. Этот шаг позволил мне получить доступ ко всем данным и начать анализ.

Original size 1597x449

Для соблюдения единого стиля всех графиков я создала словарь colors, где каждому ключу соответствует определённый цвет из моей палитры, что позволило удобно обращаться к цветам при построении графиков.

После этого я настроила общий стиль графиков, установив цвет фона графиков, цвет текста и шрифт.

Original size 1597x1011

Визуализация данных

Круговые диаграммы

Следующим шагом стало создание круговой диаграммы, которая показывает соотношение здоровых и больных пациентов.

Я подсчитала количество пациентов в каждой категории, задала подписи и выбрала цвета из палитры.

Затем я построила сам график. График был дополнен заголовком, удалена ненужная подпись оси Y, и он был сохранён в файл.

0

Круговая диаграмма. Соотношение здоровых и больных.

Круговая диаграмма показывает, что доля пациентов с сердечными заболеваниями составляет около 54,5%, а доля здоровых пациентов — около 45,5%. Это говорит о том, что среди обследуемых преобладают пациенты с признаками сердечной патологии. Разница между группами — около 9%, что подчеркивает важность анализа факторов риска и необходимости ранней диагностики.

Далее мне стало интересно: какую процентную долю среди людей с заболеванием сердца составляют мужчины, а какую женщины. Для этого я построила следующую диаграмму.

0

Круговая диаграмма показала, что среди больных пациентов доля мужчин составляет около 56,4%, а доля женщин — 43,6%. Это говорит о том, что мужчины чаще сталкиваются с сердечными заболеваниями.

Гистограмма

Для анализа возрастного фактора я построила гистограмму, чтобы понять, в какой возрастной группе чаще встречается заболевание.

0

Гистограмма. Возрастное распределение пациентов.

Гистограмма демонстрирует, что большинство пациентов находятся в возрасте от 50 до 65 лет, средний возраст — около 54 лет. Это позволяет сделать вывод, что основная группа риска — это люди среднего и предпенсионного возраста. Также наблюдается относительно малое количество молодых пациентов, что может быть связано как с низкой заболеваемостью в этой группе, так и с особенностями сбора данных.

Точечная диаграмма

Чтобы выявить связь между возрастом и максимальным пульсом, я построила точечную диаграмму, разделив точки по наличию болезни.

0

Точечная диаграмма. Связь возраста и максимального пульса.

Точечная диаграмма выявила обратную зависимость: с увеличением возраста максимальный пульс снижается. Особенно выражено это у пациентов с сердечной болезнью. Это может говорить о снижении функциональной активности сердца с возрастом и при наличии патологии. Такая закономерность даёт основание полагать, что пульс может быть одним из маркеров состояния сердечно-сосудистой системы.

Тепловая карта

Для выявления взаимосвязей между числовыми параметрами я построила тепловую карту.

Сначала была создана матрица корреляции и маска для скрытия дубликатов, затем построена сама тепловая карта.

0

Тепловая карта. Корреляция признаков.

Тепловая карта позволила выделить ключевые факторы, связанные с риском сердечных заболеваний: exang — стенокардия при нагрузке, oldpeak — смещение ST-сегмента, ca — число поражённых сосудов, thal — таллиевый дефект и age — возраст.

Однако многие параметры слабо коррелируют между собой, поэтому их влияние стоит рассматривать в совокупности. Это делает прогнозирование более сложным и требует комплексного подхода при диагностике.

Описание применения генеративной модели

Для создания обложек и иллюстративного сопровождающего материала была использована нейросеть recraft.ai.

Список промптов для генерации каждого изображения: https://docs.google.com/document/d/1eS51DOZtMQw3htj821K_TwXKf9qhNeDp7QVup3M7Q1I/edit?usp=sharing

Ссылка на модель: https://www.recraft.ai/

Источники

[1] Heart Disease Dataset https://www.kaggle.com/datasets/nzr8225/heart-disease-dataset/data

[2] Создание цветовой палитры: https://color.adobe.com/ru/

Анализ сердечных заболеваний
4
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more