找到4个数据集

标签: 基准测试开发

过滤结果
  • PQB_EQA_Based_单问题平衡具身问答基准测试完整数据

    2025年12月19日 30 9 5

    数据集概述 该数据集是一个用于验证具身问答(EQA)模型视觉数据利用能力的基准数据集。核心设计为每个问题与两个不同环境配对,产生不同答案,实现单问题层面的答案分布平衡,以此区分模型是基于环境感知回答还是依赖通用语言模型的猜测,为评估EQA模型的环境 grounding 能力提供依据。 文件详解 压缩文件组(.zip格式):...
    packageimg
  • Text2KGBench本体驱动文本生成知识图谱基准数据集

    2025年12月13日 30 124 77

    数据集概述 该数据集是用于评估语言模型在本体引导下从文本生成知识图谱能力的基准,包含Wikidata-TekGen(十个本体、一万三千四百七十四句)和DBpedia-WebNLG(十九个本体、四千八百六十句)两个子数据集,遵循本体约束提取文本事实。 文件详解 数据集以压缩包形式提供,内部结构及内容如下: - 压缩包文件:...
    packageimg
  • 整合蛋白质_配体相互作用数据库_IPLID

    2025年12月13日 30 46 45

    数据集概述 该数据集为整合蛋白质-配体相互作用数据库(IPLID),整合了BindingDB、ChEMBL等多源数据,包含蛋白质-配体相互作用数据(数值或二进制标签)、配体结构相似性(Tanimoto系数)、蛋白质序列相似性等信息,支持机器学习项目检索与基准测试开发。 文件详解 数据压缩包文件:...
    packageimg
  • 生态数据挖掘大语言模型评估与基准测试数据集

    2025年12月12日 30 16 13

    数据集概述 本数据集包含生态数据挖掘场景下大语言模型(LLM)评估的完整资源,涵盖500篇摘要数据、专家验证的标注及模型输出,辅以可复现评估流程的脚本,支持LLM性能验证、模型探索及跨领域适配。 文件详解 文件名称: CodesAndDatasets.zip 文件格式: ZIP压缩包 包含内容:...
    packageimg