找到145个数据集

标签: 文本理解

过滤结果
  • ClimaQA_SLO_斯洛文尼亚气候领域问答基准数据

    2026年1月30日 30 167 11

    数据集概述 本数据集为斯洛文尼亚气候问答基准(ClimaQA_SLO),用于检验大语言模型在斯洛文尼亚环境相关领域(如气候变化、能源、林业)的事实核查能力。数据集包含斯洛文尼亚语的气候知识问答内容,支持评估模型的气候领域专业知识准确性。 文件详解 文件名称:ClimaQA_SLO.xlsx 文件格式:XLSX...
    packageimg
  • Contexts_Retrieved_Based_NLP文本数据

    2026年1月28日 30 23 9

    数据集概述 本数据集包含通过DuckDuckGo检索的上下文文本数据,主要用于自然语言处理(NLP)相关实验。数据集共2个JSON文件,未划分训练/测试、数据/标签或原始/处理数据,所有文件直接存储于根目录,无子目录结构。 文件详解 contexts_train.json 文件格式:JSON...
    packageimg
  • Wikidata_drinks_all_饮品实体RDF数据Dump

    2026年1月27日 30 57 55

    数据集概述 本数据集是基于wdumps工具生成的Wikidata饮品相关实体RDF Dump,包含39个实体、229条陈述和2754条三元组数据,以4个文件存储,无目录层级结构,无训练/测试、数据/标签或原始/处理数据的拆分。 文件详解 文件名称:info.json 文件格式:JSON...
    packageimg
  • 数据20Newsgroup_Based_机器学习解释评估人工标注词权重数据

    2026年1月21日 30 89 31

    数据集概述 本数据集是论文“Quantitative Evaluation of Machine Learning Explanations: A Human-Grounded...
    packageimg
  • Touché22比较问题的论点检索数据集

    2025年12月22日 0 132 101

    数据集概述 该数据集为2022年Touché会议“比较问题的论点检索”任务的专用数据,包含问题主题、检索段落、评估结果等文件,覆盖相关性、立场、质量三类评估维度,支持论点检索算法的开发与评测。 文件详解 该数据集包含15个文件,按类型分为以下几类: - 问题与段落数据文件: - topics-...
    packageimg
  • PIRLS_Based_O_QISH_DARSLARIDA_学生文本理解分析教学完整数据

    2025年12月21日 30 66 11

    数据集概述 本数据集包含一份PDF文档,内容围绕在阅读课中使用PIRLS任务教授学生理解和分析文本的主题,为相关教学实践或研究提供参考资料。 文件详解 文件名称: Xidirova Gavhar Boboqul qizi.pdf 文件格式: PDF 内容说明:...
    packageimg
  • 名词复合词组合性数据集

    2025年12月6日 30 55 31

    数据集概述 该数据集包含英语、法语和巴西葡萄牙语三种语言的名词复合词组合性评分数据,以及葡萄牙语复合词的词汇替换扩展标注。评分由母语者完成,涵盖整体及各构词成分的组合性;扩展数据包含词汇替换候选及分类,支持多语言词汇语义研究。 文件详解 该数据集包含压缩包和说明文档,具体如下: - 组合性评分数据集压缩包: - comp-datasets-...
    packageimg
  • 视觉问答图像文本数据集

    2025年11月15日 30 139 21

    视觉问答图像文本数据集_Visual_Question_Answering_Image_Text_Dataset 数据来源:互联网公开数据 标签:视觉问答, 图像识别, 文本理解, 多模态学习, 深度学习, 图像描述, 自然语言处理, 数据集构建 数据概述: 该数据集包含图像文件及其对应的问答对,旨在用于视觉问答(VQA)任务。主要特征如下:...
    packageimg
  • 文本复杂度和流畅度评估数据集

    2025年10月12日 30 150 136

    文本复杂度和流畅度评估数据集_Text_Complexity_and_Fluency_Evaluation_Dataset 数据来源:互联网公开数据 标签:文本分析, 语言评估, 写作质量, 自然语言处理, 文本特征, 机器学习, 情感分析, 文本理解 数据概述:...
    packageimg
  • 文本语言流畅度评估多维度数据集

    2025年10月7日 30 131 94

    文本语言流畅度评估多维度数据集_Text_Fluency_Multi_dimensional_Evaluation_Dataset 数据来源:互联网公开数据 标签:文本评估, 语言流畅度, 多维度分析, 文本质量, 机器学习, 自然语言处理, 文本理解, 深度学习 数据概述:...
    packageimg
  • 多源知识问答推理数据集

    2025年9月18日 30 84 40

    多源知识问答推理数据集_Multi_source_Knowledge_Question_Answering_Reasoning_Dataset 数据来源:互联网公开数据 标签:问答系统, 知识推理, 自然语言处理, 多选题, 文本理解, 机器学习, 数据集构建, 语料库 数据概述:...
    packageimg
  • 天体物理多选题问答数据集

    2025年8月30日 30 134 4

    天体物理多选题问答数据集_Astrophysics_Multiple_choice_Question_Answering_Dataset 数据来源:互联网公开数据 标签:天体物理, 问答, 多选题, 机器学习, 自然语言处理, 文本理解, 科学教育, 知识图谱 数据概述:...
    packageimg
  • 印度电影问答数据集

    2025年8月25日 30 11 4

    印度电影问答数据集_Indian_Movie_Question_Answering_Dataset 数据来源:互联网公开数据 标签:问答系统, 印度电影, 自然语言处理, 文本理解, 知识抽取, 文本标注, 机器阅读理解, 多模态数据 数据概述: 该数据集包含来自印度电影领域的相关问答数据,旨在用于训练和评估问答系统。主要特征如下:...
    packageimg
  • 知识图谱主题关联数据集

    2025年8月22日 30 38 8

    知识图谱主题关联数据集_Knowledge_Graph_Topic_Correlation_Dataset 数据来源:互联网公开数据 标签:知识图谱, 主题关联, 内容推荐, 教育学习, 数据挖掘, 关系分析, 文本理解, 关联分析 数据概述: 该数据集包含来自知识图谱的数据,记录了主题与内容的关联关系。主要特征如下:...
    packageimg
  • 泰语问答数据集

    2025年8月2日 30 129 44

    泰语问答数据集_Thai_Question_Answering_Dataset 数据来源:互联网公开数据 标签:泰语, 问答系统, 自然语言处理, 文本理解, 机器阅读理解, 泰语NLP, 数据集, 文本分析 数据概述: 该数据集包含来自多个来源的泰语问答数据,旨在促进泰语自然语言处理(NLP)领域的研究和应用。主要特征如下:...
    packageimg
  • 多选题文本理解与推理数据集

    2025年7月23日 30 110 56

    多选题文本理解与推理数据集_Multiple_choice_Text_Comprehension_and_Reasoning_Dataset 数据来源:互联网公开数据 标签:文本理解, 多选题, 自然语言处理, 机器阅读理解, 问答系统, 知识推理, 数据集, 机器学习 数据概述:...
    packageimg
  • 冬奥会问答数据集_Winter_Olympics_Question_Answering_Dataset

    2025年6月25日 30 142 141

    冬奥会问答数据集_Winter_Olympics_Question_Answering_Dataset 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 事件抽取, 冬奥会, 信息检索, 机器学习, 数据集 数据概述: 该数据集包含从新闻报道和相关资料中提取的问答对,记录了关于冬季奥运会的相关信息。主要特征如下:...
    packageimg
  • 法律文本问答数据集LegalDocumentQuestionAnswering-ictworld

    2025年5月31日 30 26 11

    法律文本问答数据集LegalDocumentQuestionAnswering-ictworld 数据来源:互联网公开数据 标签:法律文本, 问答系统, 自然语言处理, 信息检索, 知识库, 文本理解, 越南语, 数据集 数据概述: 该数据集包含来自法律文本的问答对,记录了越南语环境下与法律文件相关的问答内容。主要特征如下:...
    packageimg
  • 法律文本问答数据集LegalTextQuestionAnsweringDataset-shreyasajal

    2025年5月31日 30 141 131

    法律文本问答数据集LegalTextQuestionAnsweringDataset-shreyasajal 数据来源:互联网公开数据 标签:法律文本, 问答系统, 信息抽取, 自然语言处理, 文本理解, 知识检索, 机器学习, 合同分析 数据概述:...
    packageimg
  • 代码函数文档数据集CodeFunctionDocumentationDataset-humsmughal

    2025年5月31日 30 134 68

    代码函数文档数据集CodeFunctionDocumentationDataset-humsmughal 数据来源:互联网公开数据 标签:代码分析, 软件工程, 自然语言处理, 函数文档, 机器学习, 代码生成, 文本理解, Python 数据概述:...
    packageimg