教育领域多选题LLM格式化数据集-3-4万题

教育领域多选题LLM格式化数据集-3-4万题 数据来源:互联网公开数据 标签:教育,多选题,LLM,考试,题目,问答,自然语言处理,机器学习,数据集 数据概述: 本数据集是EduQG论文中提出的多选题数据集的LLM(大型语言模型)格式化版本,包含约3.4万道来自教育领域的各种问题。原始数据来源于开源项目,并经过特定脚本处理,统一转换为适用于LLM的五选一多选题格式。原始数据包含五选一和四选一两种题型,其中四选一题目通过复制一个错误的选项,转换为五选一形式。

数据字段包括: id:题目编号 prompt:题目文本 A:选项A B:选项B C:选项C D:选项D E:选项E answer:正确答案(A, B, C, D, 或 E)

数据用途概述: 该数据集主要用于训练和评估LLM在教育领域的表现,尤其是在多选题回答方面的能力。 它可以用于: 1. LLM的微调与训练:用于训练LLM在教育考试领域的表现,使其能够更好地理解和回答多选题。 2. 模型评估:评估不同LLM在多选题上的准确率、鲁棒性等指标。 3. 研究应用:用于研究LLM在教育领域的应用,如自动出题、智能辅导等。 4. 学术研究:为自然语言处理、机器学习等领域的研究提供数据支持。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 8.74 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。