数据集概述
本数据集为计算机视觉工作坊提供图像分类训练数据,源自大英图书馆19世纪书籍图像收藏(1839年)。包含四个图像文件夹及一个许可文件,涵盖建筑、人物、纹章、人类与猫、时尚及肖像等分类,主要用作教育资源,可用于讨论历史数据标注方法。
文件详解
- 许可文件
- 文件名称:
LICENSE.txt
- 文件格式:TXT
- 字段映射介绍:说明数据无已知版权限制,允许复制、修改和分发。
- 图像压缩包
- 文件名称:
cv_workshop_exercise_data.zip
- 文件格式:ZIP
- 字段映射介绍:包含建筑、人物、纹章类图像。
- 文件名称:
humancats.zip
- 文件格式:ZIP
- 字段映射介绍:包含人类和猫类图像。
- 文件名称:
fashion.zip
- 文件格式:ZIP
- 字段映射介绍:包含按性别(女性、男性)标注的时尚类人物图像。
- 文件名称:
portraits.zip
- 文件格式:ZIP
- 字段映射介绍:包含按性别(女性、男性)标注的肖像类人物图像。
数据来源
大英图书馆19世纪书籍图像收藏(Digitised Books - Images identified as Embellishments. c. 1510 - c. 1900. JPG)
适用场景
- 计算机视觉教育:用于图像分类算法的基础训练与实践。
- 历史图像数据标注讨论:分析单标注者标注的性别分类在历史数据中的合理性与局限性。
- 多类别图像分类研究:针对建筑、人物、动物等类别开展模型训练与评估。
- 版权开放数据应用:探索无版权限制历史图像在教育和研究中的复用价值。