数据集概述
本数据集为USD植物标本馆“Colección del Padre Fuertes”标本的采集者与鉴定者关联数据,由Bionomia志愿者标注生成,基于GBIF聚合的标本数据,以Frictionless Data数据包格式组织,包含9个文件,涵盖关联归因、问题日期记录、用户信息等内容。
文件详解
- 压缩文件(共8个)
- 文件名称:citations.csv.zip、problem_collector_dates.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、users.csv.zip、occurrences.csv.zip、articles.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:ZIP
- 字段映射介绍:分别包含引用数据、采集者日期问题数据、关联归因数据、非本人声明数据、用户信息数据、标本 occurrence 数据、文献数据、鉴定者日期问题数据的CSV文件
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,包含数据集结构、文件清单等信息
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合的标本数据集(编号5a2b4f54-fba7-473d-ab85-226e2bb9f5ec)
适用场景
- 植物标本元数据标准化:用于整理USD植物标本馆历史标本的采集者、鉴定者关联信息,提升元数据质量
- 生物多样性数据溯源:通过关联数据追溯标本采集与鉴定的人员信息,支持标本历史背景研究
- 标本馆数据管理优化:分析采集者/鉴定者日期问题数据,完善标本馆数据清洗流程
- 公民科学贡献研究:基于用户信息数据,研究Bionomia志愿者参与标本数据标注的行为模式