数据集概述
本数据集包含哥伦比亚格林社区学院自然历史博物馆苔藓植物标本馆的标本数据,与采集者、鉴定者信息相关联,由志愿者在Bionomia平台标注生成,原始标本数据来自全球生物多样性信息机构(GBIF)聚合的数据集。数据集以Frictionless Data数据包格式组织,共9个文件,支持苔藓植物标本馆数据的关联查询与管理。
文件详解
- 核心数据文件
- 文件名称:occurrences.csv.zip、citations.csv.zip、attributions.csv.zip、users.csv.zip、articles.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:包含苔藓植物标本馆的标本记录、引用信息、人员关联归属、用户信息及相关文献等数据字段
- 问题数据文件
- 文件名称:problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:记录采集者/鉴定者日期问题数据及非关联人员声明数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准的数据包元数据描述文件,包含数据集结构、文件清单等信息
数据来源
Bionomia平台(由志愿者标注),原始标本数据来自全球生物多样性信息机构(GBIF)数据集(编号18a1c6ab-183c-4989-88f5-f81505d04f11)
适用场景
- 生物标本馆数据管理: 支持哥伦比亚格林社区学院自然历史博物馆苔藓植物标本馆的采集者、鉴定者与标本记录的关联管理
- 生物多样性研究: 为苔藓植物标本的采集历史、分类鉴定溯源提供结构化数据支持
- 标本数据质量控制: 利用问题数据文件分析标本馆数据中的日期错误、人员关联错误等质量问题
- 生物标本关联网络构建: 通过采集者、鉴定者与标本的关联数据,构建苔藓植物研究领域的人员-标本关联网络
- 生物多样性信息标准实践: 作为Frictionless Data格式的数据包实例,为生物多样性数据的标准化组织提供参考