数据集概述
本数据集为佛罗里达大学植物标本馆(FLAS)的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia平台志愿者标注生成,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含9个文件。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,描述数据集的结构、文件清单及相关属性
- 压缩数据文件(共8个,格式均为ZIP)
- citations.csv.zip:标本引用相关数据
- articles.csv.zip:关联的文献文章数据
- attributions.csv.zip:数据标注者的贡献归因数据
- occurrences.csv.zip:标本 occurrence(事件)数据
- users.csv.zip:参与标注的用户数据
- problem_collector_dates.csv.zip:采集者日期存在问题的标本数据
- problem_determiner_dates.csv.zip:鉴定者日期存在问题的标本数据
- not_them_assertions.csv.zip:标注为“非该采集者/鉴定者”的断言数据
数据来源
Bionomia平台(数据集ID:b89d52a2-861d-4388-adad-c0da3d55fc78),原始标本数据来自全球生物多样性信息设施(GBIF,数据集ID:b89d52a2-861d-4388-adad-c0da3d55fc78)
适用场景
- 植物标本馆数据治理:用于清理FLAS标本馆采集者、鉴定者的日期及身份关联问题数据
- 生物多样性研究:通过标本采集者、鉴定者关联信息,分析区域植物采集历史与分类学研究脉络
- 志愿者贡献分析:基于users.csv.zip和attributions.csv.zip,研究公民科学项目中志愿者的标注行为与贡献
- 标本数据标准化:以Frictionless Data格式为参考,推动植物标本关联数据的标准化管理与共享