
концепция
ПОИСК > При поиске материалов для визуализации данных с помощью возможностей языка программирования python я воспользовалась онлайн-платформой Kaggle.com, где есть специальный раздел с датасетами для визуализации.
ДАННЫЕ > Для создания проекта я выбрала данные о производительности и удовлетворенности сотрудников (ссылка на исходный датасет). Этот датасет содержал в себе много интересных данных о различных аспектах жизни офисных сотрудников: их возраст, зарплату, дату начала работы, продуктивность, удовлетворенность и фидбэк от других сотрудников.
ВИЗУАЛИЗАЦИЯ >
При анализе датасета у меня получилось 4 графика, в зависимости от видов используемых данных и способа их отношения: 1. Столбчатый 2. Линейный 3. Круговая диаграма 4. Матрица
Также для графиков был разработан единый стиль с помощью применения цветовой палитры, взятой из библиотеки MatPlotLib, а также с помощью редактирования стилей текста.
ИНСТРУМЕНТЫ > - Библиотеки NumPy, Pandas, Matplotlib - Chat GPT - Leonardo.Ai (для обложки)
предварительная обработка данных

Прежде чем приступить к визуализации я привела данные стобца «Joining Date», записанные в формате MON-YY к полной записи года. Месяцы и прочие уточнения даты в моем случае было бы целесообразно убрать, так как в данных числился только январь.
[promt]: «how to apply type of data to all values in column»

Полученная запись дала возможность заодно рассчитать и добавить столбец о длительности работы в компании для каждого сотрудника.
После проведенных вычислений я закрепила результат, приведя даты к временному значению для дальнейшего построения графиков
[promt]: «how convert integer which represents the year to the actual date, using python pandas»
график#1
[promt]: «from this data: newbies_df = df.groupby ('Joining Date').agg ({ 'Joining Date': 'count'}).rename (columns={ 'Joining Date': 'Count of newbies' }) create barplot»
график#2
[promt]: «plot a pie chart based on this data: df.groupby ('Department').agg ({ 'Department': 'count'}).rename (columns={ 'Department': 'Count of employees' })», «How can I edit labels and add values for this chart?»
график#3
[promt]: «make graphic based on this dataset: df.groupby ('Joining Date').agg ({ 'Joining Date': 'count'}).rename (columns={ 'Joining Date': 'Count of newbies' })», «make this graph more colorful and smooth», «create this diagram with this dataset: salary_by_projects = df.groupby ('Projects Completed')['Salary'].mean ().reset_index ()»
график#4
[promt]: «with matplotlib create matrices diagram where axis x = Position ('Analyst', 'Intern', 'Junior Developer', 'Manager', 'Senior Developer', 'Team Lead') and y = Gender ('Male', 'Female') It meant to count how much of each gender on every position»