数据集概述
本数据集为马格达莱纳大学生物收藏中有孔虫标本的采集者与鉴定者关联数据,由志愿者通过Bionomia平台基于全球生物多样性信息设施(GBIF)聚合的标本数据生成,包含采集者、鉴定者的归属信息及相关问题记录,采用Frictionless Data数据包格式组织,共11个文件。
文件详解
- 数据文件包配置文件:datapackage.json,JSON格式,为Frictionless Data数据包的配置文件,定义数据集结构与元信息
- 归档文件:
- citations.csv.zip:CSV压缩包,可能包含相关引用数据
- occurrences.csv.zip:CSV压缩包,可能包含标本 occurrence 数据
- problem_collector_dates.csv.zip:CSV压缩包,可能包含采集者日期问题数据
- users.csv.zip:CSV压缩包,可能包含用户相关数据
- not_them_assertions.csv.zip:CSV压缩包,可能包含“非本人”声明数据
- articles.csv.zip:CSV压缩包,可能包含相关文献数据
- missing_attributions.csv.zip:CSV压缩包,可能包含缺失归属信息数据
- problem_determiner_dates.csv.zip:CSV压缩包,可能包含鉴定者日期问题数据
数据来源
Bionomia平台志愿者基于全球生物多样性信息设施(GBIF)数据集(https://gbif.org/dataset/2526e709-6c7a-4915-a87b-84cf1966e417)生成
适用场景
- 生物标本数据管理:用于完善有孔虫标本的采集者、鉴定者归属信息,提升标本数据完整性
- 生物多样性研究:支持分析有孔虫标本采集与鉴定的人员关联网络,辅助生物分类学研究
- 数据质量评估:通过问题数据文件(如日期问题、缺失归属)识别标本数据质量问题,指导数据清洗
- 公民科学项目参考:为类似Bionomia的志愿者参与式生物数据关联项目提供方法与数据结构参考