Исходный размер 640x1024

Статистика успеваемости школьников

Данные и их нахождение

Для проекта я использовала таблицу с успеваемостью школьников 15-18 лет. Таблица также содержит сведения о поле, наличие внеурочных занятий, образовании и вовлеченности родителей в образовательный процесс ребенка и общий балл.

В работе я буду использовать столбцы с полом, Участием родителей и общим баллом учащихся.

Таблица была найдена и скачена с сайта Kaggle (работает кибер-ссылка)

Для составления графиков я решила проанализировать:

1)Соотношение студентов с успеваемостью 3-4* с участием родителей и без участия родителей

2)Соотношение студентов с успеваемостью 3-4 среди мальчиков и девочек

3)Сравнение общего балла среди девочек и мальчиков

*Максимальный бал = 4

Ход работы

Исходный размер 769x159

Сначала я импортировала все нужные библиотеки и файлы в рабочую среду

Соотношение студентов с успеваемостью 3-4 с участием родителей и без участия родителей

Исходный размер 1080x332

Сначала я создала 2 переменный (датафреймы).

Они мне были необходимы, чтобы вычленить из всей таблицы учеников с участием родителей и высоким средним баллом (pr). Датафрейм «nopr» выявляет учеников, без родительского влияния, но с высоким средним баллом.

После функцией count я посчитала количество учеников в функции «pr» и «nopr»

После я перевела полученное количество в проценты и построила круговую диаграмму.

Получился вот такой результат.

Исходный размер 850x418
Исходный размер 785x219

Эта диаграмма прекрасно демонстрирует, что влияние родителей не значительно влияет на успеваемость ребенка.

Однако она показывает соотношение учеников.

А что если мы хотим знать полное количество? Для этого построим столбчатую диаграмму

Для этого напишем код для построения столбчатой диаграммы. Так как до этого я уже посчитала количество учеников, дополнительно мне ничего пришлось.

Получаем вот такой результат.

Исходный размер 602x455

Соотношение студентов с успеваемостью 3-4 среди мальчиков и девочек

Исходный размер 1482x393

Провожу теже манипуляции, что и в первый раз, но меняю условия, заменяя «ParentalSupport' на „Gender“ и меняя значения.

В таблице 0 = мальчики, 1 = девочки. Поэтому условие записано именно таким образом.

Получаем результат.

Исходный размер 1132x418

И опять получаем результат, что пол тоже не влияет на способность ребенка получать и усваивать информацию.

Эта круговая инфографика идет вразрез с убеждением, что девочки учатся лучше.

А что по количеству?

Исходный размер 672x455

Как мы видим девочки не намного превышают мальчиков по количеству. Но это может быть связанно не со стереотипом, а с демографической ситуацией на момент составления таблицы.

Но чтобы убедиться в этом, проведем последний анализ.

Сравнение общего балла среди девочек и мальчиков

Исходный размер 1170x336

Здесь код выглядит куда проще. Все потому что мне не нужно записывать 2 переменные.

В данном случае я могу посчитать среднее значение для мальчиков и девочек одной строкой с помощью метода mean ().

Далее я строю диаграмму.

В данном случае, мне кажется, будет более уместна диаграмма «stem» (не уверена, как ее корректно перевести на русский язык)

Получаем вот такой результат.

Исходный размер 567x455

Как мы видим, различие между средним баллом незначительны.

Этот график является еще одним доказательством несостоятельности стереотипа.

Использование Нейросетей

Статистика успеваемости школьников
Проект создан 25.09.2024
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше