阿拉伯语自动简答题评分数据集AR-ASAG
数据来源:互联网公开数据
标签:阿拉伯语,自动评分,简答题,教育,评估,机器学习,自然语言处理
数据概述:
本数据集包含三个班级学生提交的三个不同考试的答案评估记录,每份考试包含16道简答题(总计48题)。数据集提供了每道题的参考答案以及学生提交的答案,共涵盖2133对参考答案与学生答案。题目类型分为五类:“عرف”(定义)、“إشرح”(解释)、“ما النتائج المترتبة على”(后果)、“علل”(理由)和“ما الفرق”(区别)。数据集以TXT、XML、XML-MOODLE和数据库(.DB)格式提供,其中.DB格式支持根据分析需求进行导出,而XML-MOODLE格式适用于Moodle电子学习平台。每对参考答案与学生答案关联有两个手动评分(Mark1和Mark2)和一个平均黄金评分(Average Gold Score),且数据集中包含所有手动评分。标注者之间的协议度为:皮尔逊相关系数r=0.8384,均方根误差RMSE=0.8381。
数据用途概述:
该数据集适用于自动简答题评分系统的开发与评估,教育研究,以及电子学习资源的创建。通过分析数据集,研究人员可以改进评分算法,提高评分的一致性和准确性;教育工作者可以利用数据进行教学评估和反馈改进;开发人员可将数据集集成到电子学习平台中,提供自动评分功能。此外,数据集还适合用于研究简答题评分标准和评分者一致性。
举例:
本数据集可用于开发自动评分系统,通过分析学生答案与参考答案之间的相似性和差异性,生成准确的评分结果。例如,教育研究者可以利用数据集比较不同评分者之间的评分一致性,并评估自动评分系统的有效性。此外,数据集还可以用于训练机器学习模型,提高评分算法的准确性和鲁棒性。