数据集概述
本数据集包含INECOL植物园生物收藏数字化与系统化项目的自然历史标本数据,关联了标本的采集者和鉴定者信息。数据由志愿者在Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,共包含9个文件。
文件详解
- 数据文件
- 文件名称:citations.csv.zip、articles.csv.zip、attributions.csv.zip、problem_collector_dates.csv.zip、not_them_assertions.csv.zip、problem_determiner_dates.csv.zip、occurrences.csv.zip、users.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:包含标本采集者、鉴定者的关联信息、引用数据、文章数据、归属信息、采集日期问题记录、鉴定日期问题记录、标本 occurrence 数据及用户数据等。
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准,描述数据集的元数据信息,包括文件清单、数据结构定义等。
数据来源
Bionomia平台志愿者标注,基于全球生物多样性信息设施(GBIF)数据集(https://gbif.org/dataset/ed80a247-379f-4286-a348-63da32c9c047)
适用场景
- 生物标本数字化管理: 用于INECOL植物园生物收藏的数字化与系统化管理,整合标本采集者、鉴定者信息。
- 生物多样性研究: 基于标本 occurrence 数据,分析区域生物多样性分布特征。
- 标本采集历史分析: 通过采集者、鉴定者关联信息及日期问题记录,研究标本采集的历史脉络与数据质量。
- 志愿者贡献研究: 分析Bionomia平台志愿者对生物标本数据标注的贡献模式与数据质量影响。