QuAIL阅读理解多选题数据集-新闻-用户故事-小说和博客-多领域-15000题

QuAIL阅读理解多选题数据集-新闻-用户故事-小说和博客-多领域-15000题 数据来源:互联网公开数据 标签:阅读理解,多选题,自然语言处理,机器学习,文本理解,问题解答,新闻,用户故事,小说,博客

数据概述: QuAIL数据集是一个用于阅读理解研究的资源,包含15,000道多选题,这些题目分布在四个不同的领域:新闻、用户故事、小说和博客。数据集中的问题经过精心设计,用于测试读者对相应文本段落的理解程度。问题类型经过平衡和标注,为研究阅读理解这一重要的认知技能提供了宝贵的工具。

数据用途概述: 该数据集适用于训练和评估阅读理解模型,以及进行相关研究。研究人员可以利用此数据集构建机器学习模型,从而预测给定问题-段落对的正确答案。此外,该数据集还可用于训练模型自动从文本段落生成多选题,或自动按类型(例如,事实性、推理性等)标记问题。该数据集也可用作评估阅读理解模型在多选题回答任务上的基准。

数据集结构: 数据集包含三个文件:train.csv、validation.csv和challenge.csv。每个文件都包含以下列:

domain:问题的领域。(字符串) metadata:关于问题的元数据。(JSON) context:问题的上下文。(字符串) question_type:问题的类型。(字符串) answers:问题的答案。(字符串列表)

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.6 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。