数据集概述
本数据集包含圭尔夫大学昆虫标本馆(DEBU)昆虫标本的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,原始标本数据来自全球生物多样性信息网络(GBIF)聚合的数据集。数据以Frictionless Data数据包格式组织,含9个文件,用于记录标本与人员的关联关系及相关元数据。
文件详解
- 数据包描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,定义数据集结构、文件清单及相关描述信息
- 压缩数据文件(共8个)
- 文件名称:
citations.csv.zip、occurrences.csv.zip、not_them_assertions.csv.zip、problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip、attributions.csv.zip、articles.csv.zip、users.csv.zip
- 文件格式:ZIP(内含CSV文件)
- 字段映射介绍:分别包含引用信息、标本记录、非关联声明、鉴定者日期问题记录、采集者日期问题记录、归属信息、相关文献及用户信息等关联数据
数据来源
Bionomia平台(志愿者标注),原始标本数据来自Global Biodiversity Information Facility(GBIF)
适用场景
- 生物标本数字化管理: 用于DEBU昆虫标本馆采集者与鉴定者信息的结构化整理与关联管理
- 生物多样性研究: 分析昆虫标本采集者、鉴定者的分布及关联关系,支撑生物多样性研究
- 标本数据质量控制: 基于问题日期记录文件,优化标本元数据的时间信息准确性
- 科学贡献归因分析: 通过归属信息文件,明确标本数据标注过程中志愿者的贡献