SQA3D_3D场景情境化问答数据集

数据集概述

该数据集围绕3D场景情境化问答任务构建,基于ScanNet的650个场景,包含6.8千个独特情境、20.4千条情境描述及33.4千个推理问题,覆盖空间关系、常识理解等能力,用于评估智能体的3D场景理解与推理性能。

文件详解

  • 文件名称: answer_counter.json:JSON格式文件,可能用于统计或记录问答相关的计数信息。
  • 文件名称: bird.zip:ZIP压缩文件,具体内容未预览,可能包含与数据集相关的鸟类或其他特定类别数据。
  • 文件名称: video.zip:ZIP压缩文件,可能包含视频类数据,用于视觉相关的情境理解任务。
  • 文件名称: sqa_task.zip:ZIP压缩文件,可能包含情境化问答任务的核心数据。
  • 文件名称: localization_task.zip:ZIP压缩文件,可能包含定位任务相关的数据。
  • 文件名称: ScanQA_format.zip:ZIP压缩文件,可能包含符合ScanQA格式的数据集内容。

适用场景

  • 3D场景理解研究:用于评估智能体对3D场景中位置、方向等情境的理解能力。
  • 多模态推理模型开发:为3D与文本结合的多模态推理模型提供训练与测试数据。
  • 空间关系与常识推理研究:探究智能体在3D环境中的空间关系理解及常识推理能力。
  • embodied AI研究:推动具身智能体在情境感知、导航及多跳推理等任务上的性能提升。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 875.55 MiB
最后更新 2025年12月19日
创建于 2025年12月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。