-
HotpotQA维基百科问答数据集
2024年11月10日 120 63 33
HotpotQA 是收集在英语维基百科上的问答数据集,包含大约 113K 众包问题,这些问题的构建需要两篇维基百科文章的介绍段落才能回答。数据集中的每个问题都带有两个黄金段落,以及这些段落中的句子列表,众包工作人员认为这些句子是回答问题所必需的支持事实。 HotpotQA 提供了多种推理策略,包括涉及问题中缺失实体的问题、交叉问题(什么满足属性 A...
-
XQuAD
2024年11月10日 30 156 111
XQuAD(Cross-lingual Question Answering Dataset)是评估跨语言问答性能的基准数据集。该数据集包含来自 SQuAD v1.1(Rajpurkar 等人,2016 年)开发集的 240 个段落和 1190...
-
SQuAD (Stanford Question Answering Dataset)问答数据集
2024年11月10日 60 21 5
斯坦福问答数据集 (SQuAD) 是一个阅读理解数据集,由众包工作人员在一组维基百科文章中提出的问题组成,其中每个问题的答案都是相应阅读文章或问题的一段文本或跨度可能无法回答。



