数据集概述
本数据集包含Pacific Union College Herbarium(PUA)植物标本馆的标本数据与采集者、鉴定者的关联信息,由Bionomia志愿者基于GBIF聚合的标本数据生成,采用Frictionless Data数据包格式,共9个文件,支持生物多样性标本相关人员信息的关联分析。
文件详解
- 压缩文件(ZIP格式)
- 文件名称:citations.csv.zip、problem_collector_dates.csv.zip、occurrences.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、articles.csv.zip
- 文件格式:ZIP
- 字段映射介绍:包含标本引用、采集者日期问题、标本记录、鉴定者日期问题、用户信息、人员归属、非本人声明、相关文献等CSV格式的标本关联数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准的数据包元数据描述文件,定义数据集的结构、文件清单及相关属性
数据来源
Global Biodiversity Information Facility(GBIF)数据集(https://gbif.org/dataset/677aece2-a65b-4b78-b391-0f2e21a2b7ed),由Bionomia志愿者Scribes标注生成
适用场景
- 生物标本人员关联分析: 研究PUA植物标本馆标本采集者、鉴定者与标本记录的归属关系
- 标本历史数据清理: 利用problem_collector_dates、problem_determiner_dates分析标本采集/鉴定日期的异常问题
- 生物多样性文献研究: 通过citations、articles文件关联标本相关的学术引用与文献资料
- 标本归属验证: 基于attributions、not_them_assertions数据验证标本人员的归属声明准确性
- 植物标本馆管理优化: 为PUA标本馆的人员信息管理、标本溯源提供数据支持