数据集概述
本数据集为卑尔根大学(UiB)真菌标本馆的自然历史标本数据,包含标本与采集者、鉴定者的关联信息。数据由志愿者在Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 数据包描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,描述数据集的整体信息、文件清单及数据结构定义
- 关联数据文件
- 文件名称:
attributions.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:包含标本与采集者、鉴定者的关联归属信息
- 文献引用文件
- 文件名称:
citations.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:标本相关的文献引用数据
- 文章信息文件
- 文件名称:
articles.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:与标本关联的学术文章信息
- 标本记录文件
- 文件名称:
occurrences.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:真菌标本的核心记录数据
- 用户信息文件
- 文件名称:
users.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:参与标注的志愿者用户信息
- 问题数据文件
- 文件名称:
problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:采集者、鉴定者日期信息存在问题的记录
- 排除断言文件
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:标注为“非该人员”的关联断言数据
数据来源
Bionomia平台(由志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合数据集
适用场景
- 生物标本馆数据管理: 用于UiB真菌标本馆采集者、鉴定者信息的标准化关联与整理
- 生物多样性研究: 分析真菌标本的采集历史、鉴定人员网络及标本分布特征
- 科学数据标注质量评估: 基于问题数据文件研究标本关联信息的标注准确性与常见问题
- 公民科学项目分析: 探索志愿者参与生物标本数据标注的行为模式与贡献价值
- 标本文献关联研究: 利用文献引用与文章信息文件,分析真菌标本相关的学术研究脉络