通用领域定性关系问答数据集-QuaRTz

通用领域定性关系问答数据集-QuaRTz 数据来源:互联网公开数据 标签:自然语言处理,问答,机器阅读,开放领域,定性推理,文本理解,多选题,人工智能 数据概述: QuaRTz(Open Domain Qualitative Benchmark,开放领域定性基准)是一个众包构建的数据集,包含3864道关于通用领域定性关系的多选题。每个问题都配有一个背景句子(有时是短段落)。该数据集旨在评估模型在理解和推理开放领域定性关系方面的能力。数据集分为训练集、验证集和测试集,方便研究人员进行模型训练和评估。

数据用途概述: 该数据集主要用于训练和评估人工智能模型在开放领域定性关系问答任务中的表现。研究人员可以使用QuaRTz数据集进行以下研究: 1. 训练AI模型自动生成关于开放领域定性关系的问题。 2. 训练AI模型自动识别关于开放领域定性关系问题的正确答案选项。 3. 评估不同AI模型在众包构建的开放领域定性关系数据集上的表现。 该数据集也适用于自然语言处理领域的学术研究,例如机器阅读理解、文本推理等。

数据集包含以下字段: * question:问题文本(字符串) * choices:问题的选项(字符串列表) * answerKey:正确选项的索引(整数) * para:包含关系的段落文本(字符串) * para_anno:段落的注释(字典) * question_anno:问题的注释(字典)

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.44 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。