数据集

QuAIL阅读理解多选题数据集-新闻-用户故事-小说和博客-多领域-15000题

QuAIL阅读理解多选题数据集-新闻-用户故事-小说和博客-多领域-15000题数据来源：互联网公开数据标签：阅读理解,多选题,自然语言处理,机器学习,文本理解,问题解答,新闻,用户故事,小说,博客

数据概述： QuAIL数据集是一个用于阅读理解研究的资源，包含15,000道多选题，这些题目分布在四个不同的领域：新闻、用户故事、小说和博客。数据集中的问题经过精心设计，用于测试读者对相应文本段落的理解程度。问题类型经过平衡和标注，为研究阅读理解这一重要的认知技能提供了宝贵的工具。

数据用途概述：该数据集适用于训练和评估阅读理解模型，以及进行相关研究。研究人员可以利用此数据集构建机器学习模型，从而预测给定问题-段落对的正确答案。此外，该数据集还可用于训练模型自动从文本段落生成多选题，或自动按类型（例如，事实性、推理性等）标记问题。该数据集也可用作评估阅读理解模型在多选题回答任务上的基准。

数据集结构：数据集包含三个文件：train.csv、validation.csv和challenge.csv。每个文件都包含以下列：

domain：问题的领域。（字符串） metadata：关于问题的元数据。（JSON） context：问题的上下文。（字符串） question_type：问题的类型。（字符串） answers：问题的答案。（字符串列表）

数据与资源

QuAIL阅读理解多选题数据集-新闻-用户故事-小说和博客-多领域-15000题.zipZIP
1.60 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	1.6 MiB
最后更新	2025年4月14日
创建于	2025年4月14日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

QuAIL阅读理解多选题数据集-新闻-用户故事-小说和博客-多领域-15000题

数据与资源

附加信息

注册成功！