-
ClimaQA_SLO_斯洛文尼亚气候领域问答基准数据
2026年1月30日 30 167 11
数据集概述 本数据集为斯洛文尼亚气候问答基准(ClimaQA_SLO),用于检验大语言模型在斯洛文尼亚环境相关领域(如气候变化、能源、林业)的事实核查能力。数据集包含斯洛文尼亚语的气候知识问答内容,支持评估模型的气候领域专业知识准确性。 文件详解 文件名称:ClimaQA_SLO.xlsx 文件格式:XLSX...
-
Contexts_Retrieved_Based_NLP文本数据
2026年1月28日 30 23 9
数据集概述 本数据集包含通过DuckDuckGo检索的上下文文本数据,主要用于自然语言处理(NLP)相关实验。数据集共2个JSON文件,未划分训练/测试、数据/标签或原始/处理数据,所有文件直接存储于根目录,无子目录结构。 文件详解 contexts_train.json 文件格式:JSON...
-
Wikidata_drinks_all_饮品实体RDF数据Dump
2026年1月27日 30 57 55
数据集概述 本数据集是基于wdumps工具生成的Wikidata饮品相关实体RDF Dump,包含39个实体、229条陈述和2754条三元组数据,以4个文件存储,无目录层级结构,无训练/测试、数据/标签或原始/处理数据的拆分。 文件详解 文件名称:info.json 文件格式:JSON...
-
数据20Newsgroup_Based_机器学习解释评估人工标注词权重数据
2026年1月21日 30 89 31
数据集概述 本数据集是论文“Quantitative Evaluation of Machine Learning Explanations: A Human-Grounded...
-
Touché22比较问题的论点检索数据集
2025年12月22日 0 132 101
数据集概述 该数据集为2022年Touché会议“比较问题的论点检索”任务的专用数据,包含问题主题、检索段落、评估结果等文件,覆盖相关性、立场、质量三类评估维度,支持论点检索算法的开发与评测。 文件详解 该数据集包含15个文件,按类型分为以下几类: - 问题与段落数据文件: - topics-...
-
PIRLS_Based_O_QISH_DARSLARIDA_学生文本理解分析教学完整数据
2025年12月21日 30 66 11
数据集概述 本数据集包含一份PDF文档,内容围绕在阅读课中使用PIRLS任务教授学生理解和分析文本的主题,为相关教学实践或研究提供参考资料。 文件详解 文件名称: Xidirova Gavhar Boboqul qizi.pdf 文件格式: PDF 内容说明:...
-
名词复合词组合性数据集
2025年12月6日 30 55 31
数据集概述 该数据集包含英语、法语和巴西葡萄牙语三种语言的名词复合词组合性评分数据,以及葡萄牙语复合词的词汇替换扩展标注。评分由母语者完成,涵盖整体及各构词成分的组合性;扩展数据包含词汇替换候选及分类,支持多语言词汇语义研究。 文件详解 该数据集包含压缩包和说明文档,具体如下: - 组合性评分数据集压缩包: - comp-datasets-...
-
视觉问答图像文本数据集
2025年11月15日 30 139 21
视觉问答图像文本数据集_Visual_Question_Answering_Image_Text_Dataset 数据来源:互联网公开数据 标签:视觉问答, 图像识别, 文本理解, 多模态学习, 深度学习, 图像描述, 自然语言处理, 数据集构建 数据概述: 该数据集包含图像文件及其对应的问答对,旨在用于视觉问答(VQA)任务。主要特征如下:...
-
文本复杂度和流畅度评估数据集
2025年10月12日 30 150 136
文本复杂度和流畅度评估数据集_Text_Complexity_and_Fluency_Evaluation_Dataset 数据来源:互联网公开数据 标签:文本分析, 语言评估, 写作质量, 自然语言处理, 文本特征, 机器学习, 情感分析, 文本理解 数据概述:...
-
文本语言流畅度评估多维度数据集
2025年10月7日 30 131 94
文本语言流畅度评估多维度数据集_Text_Fluency_Multi_dimensional_Evaluation_Dataset 数据来源:互联网公开数据 标签:文本评估, 语言流畅度, 多维度分析, 文本质量, 机器学习, 自然语言处理, 文本理解, 深度学习 数据概述:...
-
多源知识问答推理数据集
2025年9月18日 30 84 40
多源知识问答推理数据集_Multi_source_Knowledge_Question_Answering_Reasoning_Dataset 数据来源:互联网公开数据 标签:问答系统, 知识推理, 自然语言处理, 多选题, 文本理解, 机器学习, 数据集构建, 语料库 数据概述:...
-
天体物理多选题问答数据集
2025年8月30日 30 134 4
天体物理多选题问答数据集_Astrophysics_Multiple_choice_Question_Answering_Dataset 数据来源:互联网公开数据 标签:天体物理, 问答, 多选题, 机器学习, 自然语言处理, 文本理解, 科学教育, 知识图谱 数据概述:...
-
印度电影问答数据集
2025年8月25日 30 11 4
印度电影问答数据集_Indian_Movie_Question_Answering_Dataset 数据来源:互联网公开数据 标签:问答系统, 印度电影, 自然语言处理, 文本理解, 知识抽取, 文本标注, 机器阅读理解, 多模态数据 数据概述: 该数据集包含来自印度电影领域的相关问答数据,旨在用于训练和评估问答系统。主要特征如下:...
-
知识图谱主题关联数据集
2025年8月22日 30 38 8
知识图谱主题关联数据集_Knowledge_Graph_Topic_Correlation_Dataset 数据来源:互联网公开数据 标签:知识图谱, 主题关联, 内容推荐, 教育学习, 数据挖掘, 关系分析, 文本理解, 关联分析 数据概述: 该数据集包含来自知识图谱的数据,记录了主题与内容的关联关系。主要特征如下:...
-
多选题文本理解与推理数据集
2025年7月23日 30 110 56
多选题文本理解与推理数据集_Multiple_choice_Text_Comprehension_and_Reasoning_Dataset 数据来源:互联网公开数据 标签:文本理解, 多选题, 自然语言处理, 机器阅读理解, 问答系统, 知识推理, 数据集, 机器学习 数据概述:...
-
冬奥会问答数据集_Winter_Olympics_Question_Answering_Dataset
2025年6月25日 30 142 141
冬奥会问答数据集_Winter_Olympics_Question_Answering_Dataset 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 事件抽取, 冬奥会, 信息检索, 机器学习, 数据集 数据概述: 该数据集包含从新闻报道和相关资料中提取的问答对,记录了关于冬季奥运会的相关信息。主要特征如下:...
-
法律文本问答数据集LegalDocumentQuestionAnswering-ictworld
2025年5月31日 30 26 11
法律文本问答数据集LegalDocumentQuestionAnswering-ictworld 数据来源:互联网公开数据 标签:法律文本, 问答系统, 自然语言处理, 信息检索, 知识库, 文本理解, 越南语, 数据集 数据概述: 该数据集包含来自法律文本的问答对,记录了越南语环境下与法律文件相关的问答内容。主要特征如下:...
-
法律文本问答数据集LegalTextQuestionAnsweringDataset-shreyasajal
2025年5月31日 30 141 131
法律文本问答数据集LegalTextQuestionAnsweringDataset-shreyasajal 数据来源:互联网公开数据 标签:法律文本, 问答系统, 信息抽取, 自然语言处理, 文本理解, 知识检索, 机器学习, 合同分析 数据概述:...
-
代码函数文档数据集CodeFunctionDocumentationDataset-humsmughal
2025年5月31日 30 134 68
代码函数文档数据集CodeFunctionDocumentationDataset-humsmughal 数据来源:互联网公开数据 标签:代码分析, 软件工程, 自然语言处理, 函数文档, 机器学习, 代码生成, 文本理解, Python 数据概述:...



