-
Quora问答平台问题真伪分类训练数据集-2018
Quora问答平台问题真伪分类训练数据集-2018 数据来源:互联网公开数据 标签:自然语言处理,文本分类,问答系统,Quora,机器学习,训练数据,问题真伪,情感分析 数据概述:... -
自然问答数据集
自然问答数据集 数据来源:互联网公开数据 标签:自然问答,问答系统,自然语言处理,机器学习,数据预处理,问答生成,信息检索 数据概述: 本数据集由Google AI... -
MetaMathQA数学问题问答数据集Mistral-7B模型性能评估
MetaMathQA数学问题问答数据集Mistral-7B模型性能评估 数据来源:互联网公开数据 标签:数学,问答系统,自然语言处理,Mistral-7B,模型评估,机器学习,数据集,NLP 数据概述: 本数据集包含了由Mistral-7B问答系统生成的数学问题及其对应的回答。数据主要用于评估和提升MetaMathQA(MetaMath... -
Reddit问答社区百万提问数据分析数据集-AskReddit-时间序列-问答内容-不限时间
Reddit问答社区百万提问数据分析数据集-AskReddit-时间序列-问答内容-不限时间 数据来源:互联网公开数据 标签:Reddit,问答,提问,社交媒体,文本分析,自然语言处理,问答系统,问答社区,情感分析 数据概述:... -
大型语言模型训练合成数据-Synthia-v1-3数据集
大型语言模型训练合成数据-Synthia-v1-3数据集 数据来源:互联网公开数据 标签:大型语言模型,合成数据,训练数据,自然语言处理,文本生成,机器翻译,问答系统,对话生成 数据概述: 本数据集是专为大型语言模型(LLM)开发和改进而设计的合成训练数据集,主要用于研究和优化migel... -
SQuAD2-0问答系统训练数据集
SQuAD2-0问答系统训练数据集 数据来源:互联网公开数据 标签:问答系统,开放域,自然语言处理,机器学习,训练数据 数据概述: 本数据集是SQuAD 2.0训练数据集的CSV格式版本,适用于构建复杂的开放域问答系统。数据集包含问题、答案及其对应的文章段落,有助于训练模型理解上下文并生成准确的回答。 数据用途概述:... -
自然语言问答数据集QDMR分解结构分析数据集
自然语言问答数据集QDMR分解结构分析数据集 数据来源:互联网公开数据 标签:自然语言处理,问答系统,语义分解,QDMR,数据集,文本分析,机器学习,计算机科学 数据概述:... -
语言模型对比数据集
语言模型对比数据集 数据来源:互联网公开数据 标签:语言模型,对比分析,问答系统,Govinfo,正确答案,模型性能 数据概述: 本数据集包含从Govinfo网站收集的90个问题及其正确答案,并附录了五个不同语言模型对这些问题的回答。数据集涵盖了问题陈述、正确答案以及DeepSeek R1 14b qwen distill、Llama3.1... -
非监督学习自然语言处理数据集
非监督学习自然语言处理数据集 数据来源:互联网公开数据 标签:自然语言处理,非监督学习,问答系统,TF-IDF,文档检索 数据概述: 本数据集用于非监督学习中的问答系统训练。数据集中的每一行代表一个文档,适用于通过向量模型和TF-IDF方法检索用户查询的答案。该数据集包含大量的文本信息,为构建有效的问答系统提供了丰富的训练素材。 数据用途概述:... -
WikiQA开放域问答数据集-问题与句子对-开放域问答研究
WikiQA开放域问答数据集-问题与句子对-开放域问答研究 数据来源:互联网公开数据 标签:问答系统,自然语言处理,文本匹配,信息检索,知识库,开放域问答,WikiQA,机器学习,数据集 数据概述:... -
中文机器阅读理解数据集2018
中文机器阅读理解数据集2018 数据来源:互联网公开数据 标签:机器阅读理解,中文,NLP,问答系统,文本理解,文本推理,语言模型 数据概述:... -
-
StackOverflowPython3-0常见问题及解答数据集
StackOverflowPython3-0常见问题及解答数据集 数据来源:互联网公开数据 标签:Stack Overflow, Python 3.0, 编程问答, 自然语言处理, 常见问题, 代码, 技术支持, 问答系统 数据概述: 本数据集收录了Stack Overflow上关于Python... -
泰米尔语-问答数据集
泰米尔语-问答数据集 数据来源:互联网公开数据 标签:泰米尔语,问答系统,自然语言处理,NLP,机器翻译,QA挑战,斯坦福SQuAD 数据概述: 本数据集是为Chaii Hindi和泰米尔语问答挑战(Chaii Hindi and Tamil QA... -
人机协作代码搜索与问答数据集-CodeSO-QR
人机协作代码搜索与问答数据集-CodeSO-QR 数据来源:互联网公开数据 标签:人机协作,代码搜索,问答系统,代码生成,软件工程,代码质量,CodeSearchNet,Stack Overflow 数据概述: CodeSO-... -
上下文词义推理数据集
上下文词义推理数据集 数据来源:互联网公开数据 标签:词义推理,自然语言处理,语义关系,同义词,超义词,上下文分析,问答系统 数据概述: 本数据集提供了基于上下文的细粒度词义推理注释。数据集包含3,750个词对,每个词对都在一个上下文句子中出现,这些词对来自PPDB的一个子集。每个词对都被标注了在给定上下文中它们之间存在的语义关系。 数据用途概述:... -
AI问答FAQ搜索系统问题难度评估数据集
AI问答FAQ搜索系统问题难度评估数据集 数据来源:互联网公开数据 标签:FAQ,问答系统,自然语言处理,问题难度,用户查询,机器学习,文本分析 数据概述: 本数据集由ai-... -
小学科学问题数据集
小学科学问题数据集 数据来源:互联网公开数据 标签:小学科学,多选题,自然语言处理,问答系统,教育研究,人工智能,科学教育 数据概述: 本数据集包含7,787个小学科学水平的多选题,涵盖生物学、地质学、物理学、化学、天文学和环境科学等多个主题领域。数据集分为两个部分: 1. Easy... -
问答驱动阅读理解研究数据集2011-2013
问答驱动阅读理解研究数据集2011-2013 数据来源:互联网公开数据 标签:问答系统,阅读理解,自然语言处理,研究数据集,阿尔茨海默病,入学考试 数据概述: 问答驱动阅读理解(QA4MRE)数据集是由Huggingface Hub提供的一个庞大问答数据集,包含多个主题的文档及对应的问答对。该数据集作为CLEF... -
大型语言模型训练问答数据集1963-2021
大型语言模型训练问答数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,问答系统,多语言,文本生成,机器学习,训练数据,自然语言处理 数据概述:...