葡萄牙中学学生学业表现评估数据集-数学与葡萄牙语课程-2005-2006学年

葡萄牙中学学生学业表现评估数据集-数学与葡萄牙语课程-2005-2006学年 数据来源:互联网公开数据 标签:学生表现,学业成绩,教育,葡萄牙,中学,数学,葡萄牙语,社会经济因素,人口统计学,机器学习

数据概述: 本数据集包含葡萄牙两所中学学生的学业表现数据,涵盖了数学(mat)和葡萄牙语(por)两门课程。数据由学校报告和问卷调查收集,包含了学生的成绩、人口统计学特征、社会经济背景以及与学校相关的因素。数据集提供了两个独立的版本,分别对应数学和葡萄牙语课程。

数据包含30个属性字段,其中前29个字段为学生的个人信息、家庭背景、学习习惯等,最后3个字段(G1, G2, G3)代表学生的期末成绩。

数据字段包括:

  1. school - 学生所属学校(二元:'GP' - Gabriel Pereira 或 'MS' - Mousinho da Silveira)
  2. sex - 学生性别(二元:'F' - 女或 'M' - 男)
  3. age - 学生年龄(数值:15-22岁)
  4. address - 学生家庭住址类型(二元:'U' - 城市或 'R' - 农村)
  5. famsize - 家庭规模(二元:'LE3' - 少于或等于3人或 'GT3' - 大于3人)
  6. Pstatus - 父母同居状态(二元:'T' - 同居或 'A' - 分开)
  7. Medu - 母亲教育程度(数值:0 - 无,1 - 小学(4年级),2 - 5至9年级,3 - 中学,或 4 - 高等教育)
  8. Fedu - 父亲教育程度(数值:0 - 无,1 - 小学(4年级),2 - 5至9年级,3 - 中学,或 4 - 高等教育)
  9. Mjob - 母亲职业(标称:'teacher' - 教师,'health' - 健康相关,'services' - 服务业(如行政或警察),'at_home' - 在家或 'other' - 其他)
  10. Fjob - 父亲职业(标称:'teacher' - 教师,'health' - 健康相关,'services' - 服务业(如行政或警察),'at_home' - 在家或 'other' - 其他)
  11. reason - 选择这所学校的原因(标称:靠近'home' - 家,school 'reputation' - 学校声誉,'course' - 课程偏好或 'other' - 其他)
  12. guardian - 监护人(标称:'mother' - 母亲,'father' - 父亲或 'other' - 其他)
  13. traveltime - 上下学所需时间(数值:1 - 1小时)
  14. studytime - 每周学习时间(数值:1 - 10小时)
  15. failures - 过去不及格的科目数量(数值:n,如果1<=n<3,则为n,否则为4)
  16. schoolsup - 是否有额外的教育支持(二元:是或否)
  17. famsup - 是否有家庭教育支持(二元:是或否)
  18. paid - 是否有课程科目内的额外付费课程(数学或葡萄牙语)(二元:是或否)
  19. activities - 是否有课外活动(二元:是或否)
  20. nursery - 是否上过幼儿园(二元:是或否)
  21. higher - 是否想接受高等教育(二元:是或否)
  22. internet - 家里是否有互联网(二元:是或否)
  23. romantic - 是否有恋爱关系(二元:是或否)
  24. famrel - 家庭关系质量(数值:从1 - 非常差到 5 - 极好)
  25. freetime - 课后空闲时间(数值:从 1 - 非常低到 5 - 非常高)
  26. goout - 与朋友外出(数值:从 1 - 非常低到 5 - 非常高)
  27. Dalc - 工作日饮酒量(数值:从 1 - 非常低到 5 - 非常高)
  28. Walc - 周末饮酒量(数值:从 1 - 非常低到 5 - 非常高)
  29. health - 当前健康状况(数值:从 1 - 非常差到 5 - 非常好)
  30. absences - 缺课次数(数值:从 0 到 93)
  31. G1 - 第一学期成绩(数值:从 0 到 20)
  32. G2 - 第二学期成绩(数值:从 0 到 20)
  33. G3 - 期末成绩(数值:从 0 到 20,输出目标)

数据用途概述: 该数据集可用于多种教育研究和数据分析场景,包括:学生学业表现预测、影响学业成绩的因素分析、教育政策评估、个性化学习方案设计等。研究人员可以使用此数据探索不同因素对学生学业成绩的影响,例如家庭背景、学习习惯、学校环境等。该数据集也常用于机器学习模型的训练和评估,例如构建预测学生期末成绩的模型,从而帮助教育工作者更好地了解学生的学习情况,并提供有针对性的支持。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.04 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。