智利学生学业表现与留级预测数据集ChileanStudentAcademicPerformanceandRetentionPrediction-joselbarrales
数据来源:互联网公开数据
标签:学生表现, 学业评估, 留级预测, 教育数据, 成绩分析, 统计分析, 机器学习, 智利
数据概述:
该数据集包含来自智利教育系统的数据,记录了学生的学业表现、出勤率、学校类型、社会经济背景等相关信息,旨在用于分析影响学生学业成就和留级风险的因素。主要特征如下:
时间跨度:数据未明确标注时间,但可推断为特定学年或学期的学生数据。
地理范围:数据主要来源于智利境内的学校。
数据维度:包括“RURAL_RBD”(学校是否位于农村)、“GEN_ALU”(学生性别)、“EDAD_ALU”(学生年龄)、“PROM_GRAL”(平均成绩)、“ASISTENCIA”(出勤率)、“COD_DEPE22-25”(学校依赖类型编码)、“Beneficio”(是否获得奖学金)、“promedio_simce”(SIMCE考试平均成绩)和“Retencion”(是否留级)等关键字段。
数据格式:CSV格式,文件名为datosTarea3_v2.csv,易于进行数据分析和建模。
来源信息:数据来源于智利教育部门或相关教育研究项目,已进行匿名化处理。
该数据集适合用于教育研究、学生学业表现分析和留级风险预测,也适用于探索学校因素对学生学业成就的影响。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于教育学、社会学等领域的研究,例如分析学生学业成就的影响因素、评估教育政策的效果等。
行业应用:可以为教育机构提供数据支持,帮助其识别高风险学生、优化教学策略、改进资源分配等。
决策支持:支持教育部门制定更有效的教育政策,提高教育质量和公平性。
教育和培训:作为教育数据分析、机器学习等课程的实训材料,帮助学生和研究人员深入理解教育数据分析。
此数据集特别适合用于探索影响智利学生学业表现的关键因素,以及构建留级风险预测模型,从而为教育决策提供数据支持。