Original size 1240x1750

Визуализация HR-исследований

PROTECT STATUS: not protected
10

концепция

ПОИСК > При поиске материалов для визуализации данных с помощью возможностей языка программирования python я воспользовалась онлайн-платформой Kaggle.com, где есть специальный раздел с датасетами для визуализации.

ДАННЫЕ > Для создания проекта я выбрала данные о производительности и удовлетворенности сотрудников (ссылка на исходный датасет). Этот датасет содержал в себе много интересных данных о различных аспектах жизни офисных сотрудников: их возраст, зарплату, дату начала работы, продуктивность, удовлетворенность и фидбэк от других сотрудников.

ВИЗУАЛИЗАЦИЯ >

При анализе датасета у меня получилось 4 графика, в зависимости от видов используемых данных и способа их отношения: 1. Столбчатый 2. Линейный 3. Круговая диаграма 4. Матрица

Также для графиков был разработан единый стиль с помощью применения цветовой палитры, взятой из библиотеки MatPlotLib, а также с помощью редактирования стилей текста.

ИНСТРУМЕНТЫ > - Библиотеки NumPy, Pandas, Matplotlib - Chat GPT - Leonardo.Ai (для обложки)

предварительная обработка данных

big
Original size 2910x741

Прежде чем приступить к визуализации я привела данные стобца «Joining Date», записанные в формате MON-YY к полной записи года. Месяцы и прочие уточнения даты в моем случае было бы целесообразно убрать, так как в данных числился только январь.

[promt]: «how to apply type of data to all values in column»

big
Original size 2910x1052

Полученная запись дала возможность заодно рассчитать и добавить столбец о длительности работы в компании для каждого сотрудника.

Original size 2910x858

После проведенных вычислений я закрепила результат, приведя даты к временному значению для дальнейшего построения графиков

[promt]: «how convert integer which represents the year to the actual date, using python pandas»

Original size 2890x542

график#1

Original size 2418x1364
Original size 2884x1054
Original size 2908x577

[promt]: «from this data: newbies_df = df.groupby ('Joining Date').agg ({ 'Joining Date': 'count'}).rename (columns={ 'Joining Date': 'Count of newbies' }) create barplot»

график#2

Original size 2184x1303
Original size 2902x902
Original size 2912x1184

[promt]: «plot a pie chart based on this data: df.groupby ('Department').agg ({ 'Department': 'count'}).rename (columns={ 'Department': 'Count of employees' })», «How can I edit labels and add values for this chart?»

график#3

Original size 2410x1369
Original size 2906x1136
Original size 2912x624

[promt]: «make graphic based on this dataset: df.groupby ('Joining Date').agg ({ 'Joining Date': 'count'}).rename (columns={ 'Joining Date': 'Count of newbies' })», «make this graph more colorful and smooth», «create this diagram with this dataset: salary_by_projects = df.groupby ('Projects Completed')['Salary'].mean ().reset_index ()»

график#4

Original size 2333x1428
Original size 2912x980
Original size 2908x660

[promt]: «with matplotlib create matrices diagram where axis x = Position ('Analyst', 'Intern', 'Junior Developer', 'Manager', 'Senior Developer', 'Team Lead') and y = Gender ('Male', 'Female') It meant to count how much of each gender on every position»

Визуализация HR-исследований
10
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more