Original size 640x1024

Статистика успеваемости школьников

PROTECT STATUS: not protected
14

Данные и их нахождение

Для проекта я использовала таблицу с успеваемостью школьников 15-18 лет. Таблица также содержит сведения о поле, наличие внеурочных занятий, образовании и вовлеченности родителей в образовательный процесс ребенка и общий балл.

В работе я буду использовать столбцы с полом, Участием родителей и общим баллом учащихся.

Таблица была найдена и скачена с сайта Kaggle (работает кибер-ссылка)

Для составления графиков я решила проанализировать:

1)Соотношение студентов с успеваемостью 3-4* с участием родителей и без участия родителей

2)Соотношение студентов с успеваемостью 3-4 среди мальчиков и девочек

3)Сравнение общего балла среди девочек и мальчиков

*Максимальный бал = 4

Ход работы

big
Original size 769x159

Сначала я импортировала все нужные библиотеки и файлы в рабочую среду

Соотношение студентов с успеваемостью 3-4 с участием родителей и без участия родителей

big
Original size 1080x332

Сначала я создала 2 переменный (датафреймы).

Они мне были необходимы, чтобы вычленить из всей таблицы учеников с участием родителей и высоким средним баллом (pr). Датафрейм «nopr» выявляет учеников, без родительского влияния, но с высоким средним баллом.

После функцией count я посчитала количество учеников в функции «pr» и «nopr»

После я перевела полученное количество в проценты и построила круговую диаграмму.

Получился вот такой результат.

Original size 850x418
Original size 785x219

Эта диаграмма прекрасно демонстрирует, что влияние родителей не значительно влияет на успеваемость ребенка.

Однако она показывает соотношение учеников.

А что если мы хотим знать полное количество? Для этого построим столбчатую диаграмму

Для этого напишем код для построения столбчатой диаграммы. Так как до этого я уже посчитала количество учеников, дополнительно мне ничего пришлось.

Получаем вот такой результат.

Original size 602x455

Соотношение студентов с успеваемостью 3-4 среди мальчиков и девочек

Original size 1482x393

Провожу теже манипуляции, что и в первый раз, но меняю условия, заменяя «ParentalSupport' на „Gender“ и меняя значения.

В таблице 0 = мальчики, 1 = девочки. Поэтому условие записано именно таким образом.

Получаем результат.

Original size 1132x418

И опять получаем результат, что пол тоже не влияет на способность ребенка получать и усваивать информацию.

Эта круговая инфографика идет вразрез с убеждением, что девочки учатся лучше.

А что по количеству?

Original size 672x455

Как мы видим девочки не намного превышают мальчиков по количеству. Но это может быть связанно не со стереотипом, а с демографической ситуацией на момент составления таблицы.

Но чтобы убедиться в этом, проведем последний анализ.

Сравнение общего балла среди девочек и мальчиков

Original size 1170x336

Здесь код выглядит куда проще. Все потому что мне не нужно записывать 2 переменные.

В данном случае я могу посчитать среднее значение для мальчиков и девочек одной строкой с помощью метода mean ().

Далее я строю диаграмму.

В данном случае, мне кажется, будет более уместна диаграмма «stem» (не уверена, как ее корректно перевести на русский язык)

Получаем вот такой результат.

Original size 567x455

Как мы видим, различие между средним баллом незначительны.

Этот график является еще одним доказательством несостоятельности стереотипа.

Использование Нейросетей

Статистика успеваемости школьников
14
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more