数据集概述
本数据集包含UMCS昆虫学馆藏中自然历史标本与采集者、鉴定者的关联数据,由Bionomia志愿者通过GBIF聚合的标本数据标注生成,以Frictionless Data数据包格式组织,共9个文件,用于记录标本相关人员的归属信息及问题数据标注。
文件详解
- 数据文件(压缩包格式)
- 文件名称:citations.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、articles.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(包含CSV文件)
- 字段映射介绍:分别记录标本引用信息、鉴定者日期问题数据、用户信息、归属信息、非本人声明、相关文献、标本发生记录、采集者日期问题数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准的数据包元数据文件,包含数据集基本信息、文件清单及结构定义
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:a8095fbb-0758-46b8-a3a5-caf8a3e1a5b0);Bionomia平台志愿者标注
适用场景
- 生物标本数字化管理:用于UMCS昆虫学馆藏标本与采集者、鉴定者的关联信息整合与管理
- 生物多样性数据质量控制:通过问题日期数据文件分析标本记录中的时间信息错误
- 科学史研究:基于采集者与鉴定者关联数据,研究昆虫分类学历史上的人员贡献与合作网络
- 开放数据标准应用:作为Frictionless Data数据包的实例,用于生物多样性领域开放数据格式的推广与实践