数据集概述
本数据集为南卡罗来纳大学A.C.摩尔植物标本馆藻类收藏的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由志愿者在Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集,以Frictionless Data数据包格式组织,包含9个文件。
文件详解
- 主描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的描述文件,定义数据集的元数据信息
- 数据文件(压缩包格式)
- 文件名称:citations.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:包含标本相关的引用信息
- 数据文件(压缩包格式)
- 文件名称:attributions.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:包含数据标注的归属信息
- 数据文件(压缩包格式)
- 文件名称:articles.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:包含与标本相关的文献文章信息
- 数据文件(压缩包格式)
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:包含标本的 occurrence 核心数据
- 数据文件(压缩包格式)
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:包含采集者日期存在问题的记录信息
- 数据文件(压缩包格式)
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:包含鉴定者日期存在问题的记录信息
- 数据文件(压缩包格式)
- 文件名称:users.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:包含参与数据标注的用户信息
- 数据文件(压缩包格式)
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:包含标注为“非该采集者/鉴定者”的断言信息
数据来源
Bionomia平台(志愿者标注),基于全球生物多样性信息设施(GBIF)聚合的数据集(https://gbif.org/dataset/ed6ad1bd-cdfd-4147-ad22-5ad2a2fcedba)
适用场景
- 生物标本数据标准化研究:分析藻类标本采集者与鉴定者信息的关联规则与标准化方法
- 生物多样性数据质量评估:通过问题日期文件识别标本元数据中的时间维度错误
- 标本馆数据管理优化:为植物标本馆的藻类收藏数据管理提供关联数据模型参考
- 志愿者参与式科学研究:研究公民科学家在生物标本数据标注中的贡献模式
- 生物分类学历史分析:基于采集者与鉴定者关联数据追溯藻类分类学研究的历史脉络