COCO_LVIS_Open_Images_V4_Based计算机视觉数据集类别映射整合数据

数据集概述

本数据集提供COCO、LVIS、Open Images V4三个计算机视觉数据集的类别映射关系,通过半自动化流程将三类数据集整合为包含1460个唯一类别的集合,并生成每个类别的层级结构。数据集包含5个文件,支持计算机视觉任务中跨数据集的类别统一与分析。

文件详解

  • coco_classes_map.txt
  • 文件格式:TXT
  • 字段映射介绍:包含COCO数据集80个类别的映射关系,每行以“原类别=目标类别”格式存储
  • lvis_classes_map.txt
  • 文件格式:TXT
  • 字段映射介绍:包含LVIS数据集1460个类别的映射关系,每行以“原类别=目标类别”格式存储
  • openimages_classes_map.txt
  • 文件格式:TXT
  • 字段映射介绍:包含Open Images V4数据集601个类别的映射关系,每行以“原类别=目标类别”格式存储(如“accordion=accordion_(musical_instrument)”)
  • classname_hyperset_definition.csv
  • 文件格式:CSV
  • 字段映射介绍:包含最终1460个统一类别的定义与层级结构,字段包括目标类别、父类别、类别描述(如“accordion_(musical_instrument);musical_instrument;a portable box-shaped free-reed instrument...”)
  • all-classnames.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:提供所有数据集类别的并列视图,便于跨数据集类别对比

数据来源

VISIONE项目(论文“The visione video search system: exploiting off-the-shelf text search engines for large-scale video retrieval”)

适用场景

  • 计算机视觉跨数据集研究:支持COCO、LVIS、Open Images V4数据集间的类别统一,便于跨数据集模型训练与评估
  • 视觉检索系统开发:为VISIONE等内容检索系统提供统一的类别体系,提升跨数据集检索准确性
  • 数据集整合分析:用于分析不同计算机视觉数据集的类别覆盖范围与重叠关系
  • 类别层级结构研究:基于WordNet生成的类别层级,支持计算机视觉任务中的语义层级分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.28 MiB
最后更新 2026年1月12日
创建于 2026年1月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。