常识问答多选题数据集-CommonsenseQA-通用版
数据来源:互联网公开数据
标签:常识推理,问答系统,多选题,自然语言处理,机器学习,人工智能,知识图谱
数据概述:
本数据集CommonsenseQA是一个多项选择题问答数据集,旨在考察模型对常识知识的理解和推理能力。 数据集包含12,102个问题,每个问题有一个正确答案和四个干扰选项。 数据集提供了两种主要的数据集划分方式:"随机划分"(主要评估划分)和"问题标记划分",具体划分方式请参考相关论文。数据集分为训练集、验证集和测试集,分别存储在train.csv, validation.csv和test.csv文件中,每个文件都包含answerKey(正确答案)和choices(四个备选答案)两列。
数据用途概述:
该数据集主要用于训练和评估能够回答多项选择题的机器学习模型,特别是针对需要常识推理的问答任务。 研究人员可以使用该数据集训练模型,以预测CommonsenseQA数据集中问题的正确答案,评估不同模型在常识推理方面的表现。 此外,该数据集也可用于探索和发现解决CommonsenseQA数据集中的问题所需的新型常识知识。 还可以用于自然语言处理、人工智能、知识图谱等相关领域的科研和教学。