-
LAYA_问答系统训练验证数据集
2026年2月12日 30 76 57
数据集概述 本数据集为LAYA问答系统相关数据集,包含训练和验证两类数据文件,文件总数为3个,涵盖JSONL和XLSX两种格式,主要用于问答系统的训练与验证场景,无目录结构,未提供文件内容预览及说明文档。 文件详解 文件1 文件名称:validation.jsonl 文件格式:JSONL...
-
开发者代码注释实践多源讨论研究复现数据包
2026年2月9日 30 157 84
数据集概述 本数据集是论文《What do Developers Discuss about Code Comments?》的复现数据包,包含支持研究问题RQ1和RQ2的所有数据文件,涵盖论文附录、标签与主题清单、Stack Exchange查询接口说明,以及LDA分析的输入输出数据、原始问答数据和人工分析分类结果等内容。 文件详解 根目录文件...
-
NicheHazardQA_Based_问答系统数据集
2026年2月7日 30 34 13
数据集概述 本数据集为NicheHazardQA,包含一个JSON格式文件,未划分训练/测试集、数据/标签集及原始/处理数据集,无说明文档或内容预览,主要用于问答相关任务。 文件详解 数据文件 文件名称:NICHEHAZARDQA.json 文件格式:JSON 字段映射介绍:无可用内容预览,具体字段信息未提供 适用场景 问答系统开发:...
-
TopiOCQA_独立文件_问答任务训练验证数据集
2026年1月31日 30 201 156
数据集概述 本数据集为TopiOCQA数据集的独立文件,包含训练和验证两个JSON文件,无目录结构,文件类型统一为JSON格式,可用于问答相关任务的模型训练与验证。 文件详解 训练文件 文件名称:topiocqa_train.json 文件格式:JSON 字段映射介绍:未提供具体字段信息,推测包含问答任务训练所需的输入输出数据。 验证文件...
-
SEEDS_YouCount_Based_青年赋能问答与分析数据2022
2026年1月21日 30 206 118
数据集概述 本数据集为2022年4月在丹麦奥胡斯举办的Engaging Citizen Science Conference参与者贡献的数据,围绕青年赋能公民科学与公民社会科学的“为何”“如何”“谁”“何地”四个维度展开,包含参与者回答及作者分析,仅含一个文件。 文件详解 文件名称:SEEDS and YouCount Aarhus Workshop...
-
Stack_Exchange_Based_机器学习从业者最佳实践问答数据集_2021
2026年1月18日 30 31 21
数据集概述 本数据集包含Stack Exchange平台上与“机器学习”标签及“最佳实践”相关的问答内容,基于2021年3月Stack Exchange数据 dump 筛选而来,用于研究从业者讨论的机器学习最佳实践。数据涵盖问题和答案两类内容,以TXT、CSV、XLSX三种格式呈现,共6个文件。 文件详解 问题类文件...
-
Question_Answering_SNIK_Based_医疗信息管理本体问答数据集
2026年1月14日 30 31 17
数据集概述 本数据集为基于SNIK医疗信息管理本体的问答系统相关数据,包含问答操作所用数据、训练问题及按问题类型通过特定指标完成的评估结果,涉及CSV、JSON、NT三种格式共12个文件,可用于SNIK本体问答系统的训练与性能分析。 文件详解 CSV文件(共8个) 部分文件名称:textbook-...
-
低成本GPU上的大语言模型基准测试研究数据集
2025年12月5日 30 115 48
数据集概述 本数据集为论文《LLMs on Affordable GPUs: A Benchmarking Study》的配套数据,包含大语言模型在低成本GPU上的问答与计时原始数据、分析图表示例及所用源代码,支持相关研究的复现与扩展。 文件详解 文件名称: rawData.tar 文件格式: TAR (.tar) 内容说明:...
-
千万级Reddit问答数据集
2025年6月4日 30 25 3
千万级Reddit问答数据集 数据来源:互联网公开数据 标签:Reddit,问答数据,自然语言处理,机器学习,数据集,社区问答,情感分析,评分标签 数据概述:...
-
雅虎问答综合问答数据集-2000至2010年
2025年6月1日 30 183 48
雅虎问答综合问答数据集-2000至2010年 数据来源:互联网公开数据 标签:雅虎问答,综合问答,数据集,机器学习,分类,文本分析,自然语言处理,大型数据集 数据概述:...
-
TensorFlow2-0问答数据集简化版-问答数据
2025年6月1日 30 203 89
TensorFlow2-0问答数据集简化版-问答数据 数据来源:互联网公开数据 标签:TensorFlow,问答,自然语言处理,机器学习,数据集,文本分析,简化版 数据概述: 本数据集基于TensorFlow...
-
Reddit问答系统训练与测试数据集2011-thedevastator
2025年5月31日 30 87 25
Reddit问答系统训练与测试数据集2011-thedevastator 数据来源:互联网公开数据 标签:问答系统,Reddit,用户生成内容,训练数据,测试数据,自然语言处理,机器学习 数据概述:...
-
印地语和泰米尔语问答数据集HindiandTamilQuestionAnsweringDataset-urstrulysai
2025年5月29日 30 1 0
印地语和泰米尔语问答数据集HindiandTamilQuestionAnsweringDataset-urstrulysai 数据来源:互联网公开数据 标签:问答系统, 文本理解, 机器阅读, 印度语言, 印地语, 泰米尔语, 自然语言处理, 信息检索 数据概述:...
-
问答社区问题与答案训练测试数据集QuoraQuestion-AnswerTraining-TestingDataset-sark07
2025年5月28日 30 122 5
问答社区问题与答案训练测试数据集QuoraQuestion-AnswerTraining-TestingDataset-sark07 数据来源:互联网公开数据 标签:问答社区,问题回答,数据集,自然语言处理,机器学习,文本分析,对话系统,人工智能 数据概述:...
-
Firebase问答社区问题数据集FirebaseQuestionDataset-sohelaman
2025年5月28日 30 68 40
Firebase问答社区问题数据集FirebaseQuestionDataset-sohelaman 数据来源:互联网公开数据 标签:Firebase, 问答社区, 软件开发, 编程, 技术支持, 数据挖掘, 自然语言处理, Stack Overflow 数据概述: 该数据集包含来自Stack...
-
越南问答数据集VietnameseQuestionAnsweringDataset-hungnquyen
2025年5月20日 30 5 2
越南问答数据集VietnameseQuestionAnsweringDataset-hungnquyen 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本检索, 信息抽取, 越南语, 文本匹配, 知识库, 语料库 数据概述: 该数据集包含来自越南语问答系统的数据,记录了问题、上下文和答案信息,用于训练和评估越南语问答模型。主要特征如下:...
-
问题与回答数据集QIDS-may12312
2025年5月19日 30 132 106
问题与回答数据集QIDS-may12312 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,信息检索,知识图谱,文本分析,机器学习,语义理解 数据概述: 该数据集包含了来自不同领域的问答对,旨在用于构建和评估问答系统。主要特征如下: 时间跨度:数据记录的时间跨度不明确,涵盖了不同时间段的问题和答案。...
-
TensorFlow2-0问答数据集TensorFlow2-0Question-AnswerDataset-hikarukondo
2025年5月16日 30 82 32
TensorFlow2-0问答数据集TensorFlow2-0Question-AnswerDataset-hikarukondo 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,深度学习,信息检索,语言模型,AI应用 数据概述: 该数据集包含来自TensorFlow...
-
Quora高级问答数据集QuoraAdvancedDataset-vishnurapps
2025年5月15日 30 156 102
Quora高级问答数据集QuoraAdvancedDataset-vishnurapps 数据来源:互联网公开数据 标签:问答数据,自然语言处理,数据集,文本分析,机器学习,信息检索,人工智能,社交平台 数据概述: 该数据集包含来自Quora平台的高级问答数据,记录了用户在Quora上提出的各种问题和对应的回答。主要特征如下:...
-
自然语言问答上下文数据集NaturalQuestionsSmall-thedrcat
2025年5月14日 30 174 92
自然语言问答上下文数据集NaturalQuestionsSmall-thedrcat 数据来源:互联网公开数据 标签:自然语言处理, 问答系统, 文本理解, 信息检索, 机器阅读, 语料库, 数据集, 文本分析 数据概述: 该数据集包含来自互联网的自然语言问答数据,记录了用户提出的问题、相关的上下文段落以及答案。主要特征如下:...



