数据集概述
本数据集为肯尼亚EA标本馆植物标本的采集者与鉴定者关联数据,包含由Bionomia志愿者基于GBIF聚合数据生成的标本归属声明。数据集以Frictionless Data包格式组织,涵盖标本记录、引用、归属等9个文件,用于生物多样性标本元数据的关联分析。
文件详解
- 数据文件包
- 核心描述文件:
datapackage.json,JSON格式,为Frictionless Data包的元数据描述文件
- 压缩数据文件:共8个ZIP格式文件,包括:
citations.csv.zip:标本引用数据
occurrences.csv.zip:标本 occurrence 记录数据
problem_determiner_dates.csv.zip:鉴定者日期问题数据
articles.csv.zip:相关文献数据
attributions.csv.zip:标本归属声明数据
not_them_assertions.csv.zip:非归属声明数据
problem_collector_dates.csv.zip:采集者日期问题数据
users.csv.zip:参与志愿者用户数据
数据来源
Global Biodiversity Information Facility(GBIF)聚合数据集(数据集ID:863844d8-f762-11e1-a439-00145eb45e9a),由Bionomia志愿者Scribes标注生成
适用场景
- 生物标本元数据标准化研究:分析植物标本采集者、鉴定者信息的关联规则与标准化问题
- 生物多样性数据溯源:通过归属声明追溯标本数据的来源与标注过程
- 标本馆数据质量评估:利用日期问题文件识别采集、鉴定信息中的时间维度质量问题
- 公民科学参与分析:基于用户数据研究志愿者在生物多样性数据标注中的贡献模式