找到9个数据集

标签: LLM评估

过滤结果
  • 基于本体与大语言模型的医疗数据对齐评估数据集

    2025年12月25日 30 123 8

    数据集概述 该数据集包含医疗数据对齐评估的相关文件,围绕ICD-10编码、患者结局与MONDO疾病本体、HPO表型本体的映射展开,支持LLM与传统映射方法的性能对比研究,为医疗联邦学习中的数据协同提供基础。 文件详解 该数据集以ZIP压缩包形式存储,内部包含以下目录和文件: - 输入数据文件(input目录): -...
    packageimg
  • 数据4917个表型数据包与10语言提示词及LLM评估结果数据集

    2025年12月16日 30 79 12

    数据集概述 该数据集包含4917个GA4GH表型数据包,以及基于这些数据包生成的10种语言(英、中、捷克、荷兰、法、德、意、日、西、土耳其语)的提示词,同时收录了GPT-4o和Meditron3-70B模型的多语言能力评估结果,用于罕见遗传病诊断领域的大语言模型研究。 文件详解 文件名称: ppkts_4917set.txt,文件格式: TXT 内容:...
    packageimg
  • CADog_CAD网页查看器评估数据集

    2025年12月14日 30 41 15

    数据集概述 该数据集是CADog(CAD网页查看器)的评估数据集,包含多种格式的几何文件,分为网格、CAD零件、装配体及元数据四类,用于测试CAD查看器的功能与性能。 文件详解 该数据集包含一个ZIP压缩文件,内部文件存储于evaluation-files目录,具体说明如下: - 压缩包文件: - cadog-evaluation-data.zip:...
    packageimg
  • Android应用多模态GUI测试生成的LLM评估数据集

    2025年12月13日 30 63 27

    数据集概述 本数据集是围绕Android应用多模态GUI测试生成任务的大语言模型(LLM)评估相关数据,以压缩包形式存储,未提供具体内容预览。 文件详解 文件名称: dataset+results.zip 文件格式: ZIP (.zip) 内容说明:...
    packageimg
  • 生态数据挖掘大语言模型评估与基准测试数据集

    2025年12月12日 30 107 15

    数据集概述 本数据集包含生态数据挖掘场景下大语言模型(LLM)评估的完整资源,涵盖500篇摘要数据、专家验证的标注及模型输出,辅以可复现评估流程的脚本,支持LLM性能验证、模型探索及跨领域适配。 文件详解 文件名称: CodesAndDatasets.zip 文件格式: ZIP压缩包 包含内容:...
    packageimg
  • 系统评价标题摘要筛选大语言模型评估数据集

    2025年12月5日 30 85 70

    数据集概述 该数据集是用于评估大语言模型(LLMs)在系统评价标题-摘要筛选任务中表现的专用数据集(SESR-Eval),包含实验数据、LLM结果及相关文档,支持复现研究与基准测试。 文件详解 该数据集以压缩包形式组织,内部包含以下核心目录: - 数据目录(data):包含复制包选择、信度协议、处理后数据、LLM结果及SESR-...
    packageimg
  • 金融问答基准测试数据集-2023-yousefsaeedian

    2025年4月22日 30 125 17

    金融问答基准测试数据集-2023-yousefsaeedian 数据来源:互联网公开数据 标签:金融问答,LLM评估,公开数据,金融文档,机器学习模型,性能基准,企业应用 数据概述:...
    packageimg
  • 验证集-500

    2025年4月14日 30 207 96

    验证集-500 数据来源:互联网公开数据 标签:验证集,数据集,机器学习,自然语言处理,评估,LLM评估,GPT4 数据概述: 本数据集基于Kaggle上的“wuwenmin/llm-sci-...
    packageimg
  • 拉乌尔数据集

    2025年4月14日 30 50 0

    拉乌尔数据集 数据来源:互联网公开数据 标签:LLM评估,数学问题,模型性能,步骤分析,公式验证,领域多样性,教育培训 数据概述:...
    packageimg