高等教育学生辍学预测数据集-UCI-kapturovalexander
数据来源:互联网公开数据
标签:学生辍学,高等教育,机器学习,学术研究,预测分析,数据预处理
数据概述:
本数据集用于高等教育领域中学生辍学与毕业情况的预测研究。该数据集旨在通过机器学习技术识别学生在学术生涯早期阶段的风险,以实施相应的支持策略,减少学术辍学和失败现象。数据集包含学生入学时已知的信息,涵盖学术路径、人口统计学特征和社会经济因素等关键要素。
数据用途概述:
该数据集适用于高等教育领域的学生预测分析、辍学风险评估、支持策略制定等场景。教育研究者和政策制定者可以利用该数据集进行学生表现预测,优化教育资源配置,并制定有效的支持措施。教师和学生亦可借此数据加深对高等教育成功因素的理解。
数据集中的每个实例代表一名学生。在项目中,数据集采用了80%的训练集和20%的测试集的划分方式。数据预处理过程中,研究人员对异常值、不可解释的异常点和缺失值进行了严格的处理,确保数据质量和有效性。
数据集支持由葡萄牙SATDAP - Capacitação da Administração Pública项目资助,资助编号为POCI-05-5762-FSE-000191。相关研究结果发表在《Trends and Applications in Information Systems and Technologies》期刊上,标题为《高等教育学生表现的早期预测:一个案例研究》,作者包括Mónica V. Martins, Daniel Tolledo, Jorge Machado, Luís M. T. Baptista, 和 Valentim Realinho。