-
PQB_EQA_Based_单问题平衡具身问答基准测试完整数据
2025年12月19日 30 43 22
数据集概述 该数据集是一个用于验证具身问答(EQA)模型视觉数据利用能力的基准数据集。核心设计为每个问题与两个不同环境配对,产生不同答案,实现单问题层面的答案分布平衡,以此区分模型是基于环境感知回答还是依赖通用语言模型的猜测,为评估EQA模型的环境 grounding 能力提供依据。 文件详解 压缩文件组(.zip格式):...
2025年12月19日 30 43 22