Введение
Меня всегда интересовала медицина и биология.
Но особое внимание я обращала на такое заболевание, как Рак. Поэтому я взяла датасет, связанный с данной тематикой.
В данном случае, речь идёт о линейной регрессии рака.
Описание датасета от его автора (перевод с английского)
Учебное пособие по модели линейной регрессии рака
Аннотированный пример линейной регрессии с использованием открытых данных с порталов открытого правительства резюме Пошаговое руководство по линейной регрессии
Этот пример построен с использованием Python. Он охватывает:
— Как автор получал и импортировал данные — Подготовка данных — Исследовательский анализ — Выбор модели — Диагностика модели
(Обратите внимание, что это первая попытка прохождения, и ее следует рассматривать как базовую модель для сравнения с будущими итерациями.)
Работа над созданием графиков/диаграмм
Датасет я нашла на данном ресурсе: https://data.world/datasets/open-data
Далее я преобразовала файл csv в ссылку на датасет с помощью сайта: https://github.com
Затем я вписала данную ссылку в Google Collab и уже там приступила к работе с кодом.
Там мне предложили несколько варианта графиков, код которых я стала переделывать с помощью чата GPT.
Графики
Мой код и получившиеся диаграммы выглядят данным образом:
Для визуального и информационного упрощения я сократила все диаграммы до топ-10.
И теперь они выглядят так:
Итоговые графики
Цветовая палитра создана на сайте: https://coolors.co
Модифицированные под единый стиль (за счёт единой палитры и пары шрифтов) диаграммы:
В заключении
Подобные датасеты достаточно важны для медицины. Они могут поспособствовать дополнительному анализу данного заболевания, что имеет возможность помочь в её изучении и дальнейшем способе лечения.
Ссылки




