找到1个数据集

分类: 公开数据 标签: 一百零二题

过滤结果
  • 多模态大语言模型在物理概念测试的响应数据集2025

    2025年12月6日 30 141 47

    数据集概述 该数据集包含多款多模态大语言模型对四个物理概念测试(需图像解读)的完整响应,测试包括BEMA、TUG-K、QMVI和FTGOT,共一百零二题,每题提交十次,覆盖十五款模型的测试结果。 文件详解 文件名称:Polverini, Gregorcic - Data 2025-08-19.zip 文件格式:ZIP(压缩包)...
    packageimg