数据集概述
本数据集为NHMD鸟类学标本数据与采集者、鉴定者的关联数据,由志愿者通过Bionomia平台基于GBIF聚合的标本数据生成,包含9个文件,以压缩包和JSON格式为主,用于记录标本相关人员的关联信息及问题数据。
文件详解
- 数据文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包描述文件,包含数据集元数据信息
- 压缩包文件
- 文件名称:citations.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本相关引用数据
- 文件名称:users.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:参与数据标注的用户信息
- 文件名称:occurrences.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本 occurrence 数据
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:采集者日期存在问题的数据
- 文件名称:not_them_assertions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:非本人关联的声明数据
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:鉴定者日期存在问题的数据
- 文件名称:attributions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本与人员的关联归属数据
- 文件名称:articles.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:相关文献文章数据
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合的NHMD Ornithology Collection标本数据
适用场景
- 生物标本数据标准化:用于清理和规范NHMD鸟类学标本的采集者、鉴定者关联信息及日期数据
- 生物多样性信息管理:支持NHMD鸟类学标本数据的关联分析与管理
- 志愿者贡献研究:分析Bionomia平台志愿者对生物标本数据标注的贡献情况
- 标本数据质量控制:通过问题数据文件识别和修正标本关联信息中的错误