数据集概述
本数据集包含2016年及之前BSBI苏格兰其他数据中,与采集者和鉴定者关联的自然历史标本数据。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据,采用Frictionless Data数据包格式组织,共9个文件。
文件详解
- 数据集描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,描述数据集的结构、字段定义等信息
- 关联数据文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本相关的引用信息
- 关联数据文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鉴定者日期存在问题的记录
- 关联数据文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:相关文献文章信息
- 关联数据文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:非目标人员的断言记录
- 关联数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本 occurrence(出现记录)信息
- 关联数据文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者与鉴定者的归属信息
- 关联数据文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者日期存在问题的记录
- 关联数据文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与标注的用户信息
数据来源
Bionomia平台(https://bionomia.net/dataset/53f13c8f-413e-4537-bda6-98666cd7975f)、全球生物多样性信息设施(GBIF,https://gbif.org/dataset/53f13c8f-413e-4537-bda6-98666cd7975f)
适用场景
- 生物标本数据溯源分析: 用于追踪BSBI苏格兰标本的采集者、鉴定者信息及数据来源
- 生物多样性研究: 结合标本 occurrence 数据,分析苏格兰地区生物多样性分布
- 自然历史数据质量评估: 通过problem_determiner_dates、problem_collector_dates等文件,评估标本元数据质量
- 公民科学贡献分析: 利用users.csv.zip分析志愿者在生物标本数据标注中的参与情况
- 生物标本引用网络研究: 通过citations.csv.zip和articles.csv.zip,研究标本相关文献的引用关系