数据集概述
本数据集为SMNG蛛形纲中气门亚目标本库的采集者与鉴定者关联数据,由Bionomia志愿者标注,基于GBIF聚合的标本数据生成,包含标本采集、鉴定相关的关联信息及问题记录,采用Frictionless Data包格式组织,共9个文件。
文件详解
- 核心数据文件
- 文件名称:citations.csv.zip、attributions.csv.zip、occurrences.csv.zip、articles.csv.zip、users.csv.zip
- 文件格式:CSV压缩包(ZIP)
- 字段映射介绍:包含标本采集者、鉴定者的关联引用、归属信息、标本 occurrence 数据、相关文献及标注用户信息
- 问题记录文件
- 文件名称:problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip、not_them_assertions.csv.zip
- 文件格式:CSV压缩包(ZIP)
- 字段映射介绍:记录鉴定者日期问题、采集者日期问题及非关联断言的异常数据
- 数据描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data标准的数据包描述文件,包含数据集元信息、文件清单及结构定义
数据来源
Global Biodiversity Information Facility(GBIF)数据集(bc8bb608-aeb7-4fb5-b0e0-1c5c6795455f),经Bionomia志愿者标注生成
适用场景
- 生物标本采集历史研究:分析SMNG中气门亚目标本的采集者、鉴定者网络及历史记录
- 生物多样性数据质量校验:利用问题记录文件识别标本日期、人员关联的异常数据,优化标本库数据质量
- 分类学研究支持:通过标本与采集者、鉴定者的关联,辅助中气门亚目分类学文献追溯与作者分析
- 公民科学数据应用:研究Bionomia志愿者标注模式对生物标本元数据完善的贡献价值