
Данные и их нахождение
Для проекта я использовала таблицу с успеваемостью школьников 15-18 лет. Таблица также содержит сведения о поле, наличие внеурочных занятий, образовании и вовлеченности родителей в образовательный процесс ребенка и общий балл.
В работе я буду использовать столбцы с полом, Участием родителей и общим баллом учащихся.
Таблица была найдена и скачена с сайта Kaggle (работает кибер-ссылка)
Для составления графиков я решила проанализировать:
1)Соотношение студентов с успеваемостью 3-4* с участием родителей и без участия родителей
2)Соотношение студентов с успеваемостью 3-4 среди мальчиков и девочек
3)Сравнение общего балла среди девочек и мальчиков
*Максимальный бал = 4
Ход работы

Сначала я импортировала все нужные библиотеки и файлы в рабочую среду
Соотношение студентов с успеваемостью 3-4 с участием родителей и без участия родителей

Сначала я создала 2 переменный (датафреймы).
Они мне были необходимы, чтобы вычленить из всей таблицы учеников с участием родителей и высоким средним баллом (pr). Датафрейм «nopr» выявляет учеников, без родительского влияния, но с высоким средним баллом.
После функцией count я посчитала количество учеников в функции «pr» и «nopr»
После я перевела полученное количество в проценты и построила круговую диаграмму.
Получился вот такой результат.
Эта диаграмма прекрасно демонстрирует, что влияние родителей не значительно влияет на успеваемость ребенка.
Однако она показывает соотношение учеников.
А что если мы хотим знать полное количество? Для этого построим столбчатую диаграмму
Для этого напишем код для построения столбчатой диаграммы. Так как до этого я уже посчитала количество учеников, дополнительно мне ничего пришлось.
Получаем вот такой результат.
Соотношение студентов с успеваемостью 3-4 среди мальчиков и девочек
Провожу теже манипуляции, что и в первый раз, но меняю условия, заменяя «ParentalSupport' на „Gender“ и меняя значения.
В таблице 0 = мальчики, 1 = девочки. Поэтому условие записано именно таким образом.
Получаем результат.
И опять получаем результат, что пол тоже не влияет на способность ребенка получать и усваивать информацию.
Эта круговая инфографика идет вразрез с убеждением, что девочки учатся лучше.
А что по количеству?
Как мы видим девочки не намного превышают мальчиков по количеству. Но это может быть связанно не со стереотипом, а с демографической ситуацией на момент составления таблицы.
Но чтобы убедиться в этом, проведем последний анализ.
Сравнение общего балла среди девочек и мальчиков
Здесь код выглядит куда проще. Все потому что мне не нужно записывать 2 переменные.
В данном случае я могу посчитать среднее значение для мальчиков и девочек одной строкой с помощью метода mean ().
Далее я строю диаграмму.
В данном случае, мне кажется, будет более уместна диаграмма «stem» (не уверена, как ее корректно перевести на русский язык)
Получаем вот такой результат.
Как мы видим, различие между средним баллом незначительны.
Этот график является еще одним доказательством несостоятельности стереотипа.
Использование Нейросетей