Описание
Для того, чтобы быть успешным в сегодняшнем мире мало заниматься только тем, что нравится. Необходимо исследовать инновационные области и осваивать новые скиллы, которых с каждодневным развитием технологий становится все больше и больше. Нужно быть готовым к изменениям. Подходить к ним ответственно и изучать информацию углубленно, а не бояться технологического прогресса. Ведь это может помочь в карьере и самореализации.
В рамках данного проекта я провожу анализ датасета «Future Jobs & Skills Demand» с сайта Kaggle. Дата сет содержит информацию о 10,000 объявлениях о рабочих вакансиях в популярных отраслях. Каждая запись включает в себя название должности, отрасль, местоположение, заработную плату (USD), необходимые навыки, возможность удаленной работы, размер компании и дату публикации.
Цель проекта — изучить рынок профессий будущего, выбрать топ-10 по высоте средней заработной платы. Посмотреть зависит ли зарплата от размера компании, отличается ли средняя заработная плата в больших, средних или маленьких компаниях. Изучить, в каких странах самая высокая средняя зарплата. И в конце посмотреть, какой формат в работах будущего превалирует: удаленный или все же офисный?
При создании графиков была использованная следующая цветовая палитра: blue #2A5CAA, light_ blue #5DA5DA, light_green #60BD68, red #F15854.
Для визуализации данных были использованы следующие графики: Линейная диаграмма Круговая диаграмма Столбчатая диаграмма Секторная диаграмма
Подключаем библиотеки, настраиваем шрифт, стили графиков и определенную цветовую палитру. Загружаем данные из файла future_jobs_dataset.csv
Создаем картинку с демонстрацией всех используемых цветов проекта.
Запускаем все функции по очереди и выводим текстовые результаты в консоль.
Линейная диаграмма
В первом графике я решила проанализировать топ-10 профессий по средней зарплате. Из дата сета были взяты данные, для их визуализации я выбрала линейную диаграмму. Нашли самую высокую зарплату и построили график топ-10 профессий по среднему доходу. Pandas использовался с целью обработки информации датасета и подготовки данных перед их отрисовкой. Для визуализации данных matplotlib.
Круговая диаграмма
Во втором графике я решила проанализировать среднюю заработную плату в зависимости от размера компании. Для визуализации данных я выбрала круговую диаграмму. Анализируем зарплаты в зависимости от размера компании и строим график. Pandas использовался с целью обработки информации датасета и подготовки данных перед их отрисовкой. Для визуализации данных использовался данных matplotlib.
Столбчатая диаграмма
В третьем графике я проанализировала локации, где самая высокая средняя заработная плата. Считаем среднюю зарплату по локациями, берём топ-5 и создаем столбчатую диаграмму. Pandas использовался с целью обработки информации датасета и подготовки данных перед их отрисовкой. Для визуализации данных matplotlib.
Секторная диаграмма
В четвертом графике я проанализировала соотношение офисного и удаленного формата работы. Считаем количество удаленных и офисных вакансий, создаем секторную диаграмму. Pandas использовался с целью обработки информации датасета и подготовки данных перед их отрисовкой. Для визуализации данных использовался matplotlib.
В рамках данного проекта был проведен анализ датасета «Future Jobs & Skills Demand» и визуализация его данных. Он позволил нам изучить статистику, проанализировать среднюю заработную плату по профессиям и локациям и понять, какие работы сейчас высоко оцениваются.



