数据集概述
本数据集为Mohonk Preserve Herbarium标本的采集者与鉴定者关联数据,包含志愿者通过Bionomia平台对GBIF聚合标本数据的声明与归属信息,以Frictionless Data数据包格式组织,共9个文件,用于生物标本相关人员关联分析。
文件详解
- 数据文件(共8个ZIP格式文件)
- 文件名称:citations.csv.zip、not_them_assertions.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip、occurrences.csv.zip、articles.csv.zip、attributions.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:包含标本引用、非归属声明、采集者/鉴定者日期问题记录、用户信息、标本 occurrence 数据、相关文章及归属信息等字段(具体字段需解压后查看CSV内容)
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data标准的数据包元数据文件,包含数据集基本信息、文件清单及结构描述等字段
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号ffe1030d-42d1-4bb5-8400-1123cc859a5a),由Bionomia平台志愿者Scribes处理生成
适用场景
- 生物标本人员关联分析:研究Mohonk Preserve Herbarium标本采集者与鉴定者的归属关系及历史记录
- 标本数据质量核查:通过problem_collector_dates等文件分析采集者/鉴定者日期信息的准确性问题
- 生物多样性数据溯源:利用citations和attributions文件追溯标本数据的引用与归属来源
- 志愿者贡献研究:通过users.csv.zip分析Bionomia平台志愿者对标本数据处理的贡献情况