数据集 - 海数据

PQB_EQA_Based_单问题平衡具身问答基准测试完整数据

2025年12月19日 30 9 5

数据集概述该数据集是一个用于验证具身问答（EQA）模型视觉数据利用能力的基准数据集。核心设计为每个问题与两个不同环境配对，产生不同答案，实现单问题层面的答案分布平衡，以此区分模型是基于环境感知回答还是依赖通用语言模型的猜测，为评估EQA模型的环境 grounding 能力提供依据。文件详解压缩文件组（.zip格式）：...

ZIP

Text2KGBench本体驱动文本生成知识图谱基准数据集

2025年12月13日 30 124 77

数据集概述该数据集是用于评估语言模型在本体引导下从文本生成知识图谱能力的基准，包含Wikidata-TekGen（十个本体、一万三千四百七十四句）和DBpedia-WebNLG（十九个本体、四千八百六十句）两个子数据集，遵循本体约束提取文本事实。文件详解数据集以压缩包形式提供，内部结构及内容如下： - 压缩包文件:...