葡萄牙中学学生学业表现评估数据集-数学与葡萄牙语课程-2005-2006学年
数据来源:互联网公开数据
标签:学生表现,学业成绩,教育,葡萄牙,中学,数学,葡萄牙语,社会经济因素,人口统计学,机器学习
数据概述:
本数据集包含葡萄牙两所中学学生的学业表现数据,涵盖了数学(mat)和葡萄牙语(por)两门课程。数据由学校报告和问卷调查收集,包含了学生的成绩、人口统计学特征、社会经济背景以及与学校相关的因素。数据集提供了两个独立的版本,分别对应数学和葡萄牙语课程。
数据包含30个属性字段,其中前29个字段为学生的个人信息、家庭背景、学习习惯等,最后3个字段(G1, G2, G3)代表学生的期末成绩。
数据字段包括:
- school - 学生所属学校(二元:'GP' - Gabriel Pereira 或 'MS' - Mousinho da Silveira)
- sex - 学生性别(二元:'F' - 女或 'M' - 男)
- age - 学生年龄(数值:15-22岁)
- address - 学生家庭住址类型(二元:'U' - 城市或 'R' - 农村)
- famsize - 家庭规模(二元:'LE3' - 少于或等于3人或 'GT3' - 大于3人)
- Pstatus - 父母同居状态(二元:'T' - 同居或 'A' - 分开)
- Medu - 母亲教育程度(数值:0 - 无,1 - 小学(4年级),2 - 5至9年级,3 - 中学,或 4 - 高等教育)
- Fedu - 父亲教育程度(数值:0 - 无,1 - 小学(4年级),2 - 5至9年级,3 - 中学,或 4 - 高等教育)
- Mjob - 母亲职业(标称:'teacher' - 教师,'health' - 健康相关,'services' - 服务业(如行政或警察),'at_home' - 在家或 'other' - 其他)
- Fjob - 父亲职业(标称:'teacher' - 教师,'health' - 健康相关,'services' - 服务业(如行政或警察),'at_home' - 在家或 'other' - 其他)
- reason - 选择这所学校的原因(标称:靠近'home' - 家,school 'reputation' - 学校声誉,'course' - 课程偏好或 'other' - 其他)
- guardian - 监护人(标称:'mother' - 母亲,'father' - 父亲或 'other' - 其他)
- traveltime - 上下学所需时间(数值:1 - 1小时)
- studytime - 每周学习时间(数值:1 - 10小时)
- failures - 过去不及格的科目数量(数值:n,如果1<=n<3,则为n,否则为4)
- schoolsup - 是否有额外的教育支持(二元:是或否)
- famsup - 是否有家庭教育支持(二元:是或否)
- paid - 是否有课程科目内的额外付费课程(数学或葡萄牙语)(二元:是或否)
- activities - 是否有课外活动(二元:是或否)
- nursery - 是否上过幼儿园(二元:是或否)
- higher - 是否想接受高等教育(二元:是或否)
- internet - 家里是否有互联网(二元:是或否)
- romantic - 是否有恋爱关系(二元:是或否)
- famrel - 家庭关系质量(数值:从1 - 非常差到 5 - 极好)
- freetime - 课后空闲时间(数值:从 1 - 非常低到 5 - 非常高)
- goout - 与朋友外出(数值:从 1 - 非常低到 5 - 非常高)
- Dalc - 工作日饮酒量(数值:从 1 - 非常低到 5 - 非常高)
- Walc - 周末饮酒量(数值:从 1 - 非常低到 5 - 非常高)
- health - 当前健康状况(数值:从 1 - 非常差到 5 - 非常好)
- absences - 缺课次数(数值:从 0 到 93)
- G1 - 第一学期成绩(数值:从 0 到 20)
- G2 - 第二学期成绩(数值:从 0 到 20)
- G3 - 期末成绩(数值:从 0 到 20,输出目标)
数据用途概述:
该数据集可用于多种教育研究和数据分析场景,包括:学生学业表现预测、影响学业成绩的因素分析、教育政策评估、个性化学习方案设计等。研究人员可以使用此数据探索不同因素对学生学业成绩的影响,例如家庭背景、学习习惯、学校环境等。该数据集也常用于机器学习模型的训练和评估,例如构建预测学生期末成绩的模型,从而帮助教育工作者更好地了解学生的学习情况,并提供有针对性的支持。