数据集概述
本数据集提供COCO、LVIS、Open Images V4三个计算机视觉数据集的类别映射关系,通过半自动化流程将三类数据集整合为包含1460个唯一类别的集合,并生成每个类别的层级结构。数据集包含5个文件,支持计算机视觉任务中跨数据集的类别统一与分析。
文件详解
- coco_classes_map.txt
- 文件格式:TXT
- 字段映射介绍:包含COCO数据集80个类别的映射关系,每行以“原类别=目标类别”格式存储
- lvis_classes_map.txt
- 文件格式:TXT
- 字段映射介绍:包含LVIS数据集1460个类别的映射关系,每行以“原类别=目标类别”格式存储
- openimages_classes_map.txt
- 文件格式:TXT
- 字段映射介绍:包含Open Images V4数据集601个类别的映射关系,每行以“原类别=目标类别”格式存储(如“accordion=accordion_(musical_instrument)”)
- classname_hyperset_definition.csv
- 文件格式:CSV
- 字段映射介绍:包含最终1460个统一类别的定义与层级结构,字段包括目标类别、父类别、类别描述(如“accordion_(musical_instrument);musical_instrument;a portable box-shaped free-reed instrument...”)
- all-classnames.xlsx
- 文件格式:XLSX
- 字段映射介绍:提供所有数据集类别的并列视图,便于跨数据集类别对比
数据来源
VISIONE项目(论文“The visione video search system: exploiting off-the-shelf text search engines for large-scale video retrieval”)
适用场景
- 计算机视觉跨数据集研究:支持COCO、LVIS、Open Images V4数据集间的类别统一,便于跨数据集模型训练与评估
- 视觉检索系统开发:为VISIONE等内容检索系统提供统一的类别体系,提升跨数据集检索准确性
- 数据集整合分析:用于分析不同计算机视觉数据集的类别覆盖范围与重叠关系
- 类别层级结构研究:基于WordNet生成的类别层级,支持计算机视觉任务中的语义层级分析