数据集概述
本数据集是UiB维管植物标本馆(Vascular Plant Herbarium, UiB)的标本数据与采集者、鉴定者的关联数据。数据由志愿者在Bionomia平台上标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集,采用Frictionless Data数据包格式组织,包含9个文件,覆盖标本记录、人员关联、文献引用等多类信息。
文件详解
- 核心数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含维管植物标本的基础记录信息,如标本编号、物种名称、采集信息等(具体字段未提供预览)
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含标本与采集者、鉴定者的关联归属信息(具体字段未提供预览)
- 辅助数据文件
- 文件名称:citations.csv.zip、articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含相关文献引用信息(具体字段未提供预览)
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含排除错误人员关联的声明信息(具体字段未提供预览)
- 文件名称:problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含鉴定者、采集者日期信息中的问题记录(具体字段未提供预览)
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含参与标注的志愿者用户信息(具体字段未提供预览)
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,推测包含数据集结构、文件清单等信息(具体字段未提供预览)
数据来源
Bionomia平台(由志愿者Scribes标注),基于Global Biodiversity Information Facility(GBIF)聚合的数据集(数据集ID:4db619a6-9429-4bef-90c9-06cc90c39552)
适用场景
- 生物标本数据管理: 用于UiB维管植物标本馆标本记录与采集者、鉴定者信息的关联整合
- 生物多样性研究: 支持基于标本记录的物种分布、采集历史分析
- 科学史研究: 分析维管植物标本采集者、鉴定者的人员网络与工作历史
- 数据质量优化: 利用问题日期、错误关联记录改进标本元数据质量
- 志愿者贡献分析: 通过用户数据研究公民科学参与者在生物标本标注中的贡献模式