数据集概述
本数据集是Natural history specimen data linked to collectors and determiners held within, "Digital Herbarium - NGCPR"的关联数据,包含由志愿者在Bionomia上标注的标本采集者与鉴定者信息,基于GBIF聚合的NGCPR数字标本馆数据,以Frictionless Data包格式组织,共11个文件。
文件详解
- 数据组织文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的描述文件,定义数据集的元数据、文件清单及结构规范
- 关联数据文件
- 文件名称:citations.csv.zip、articles.csv.zip、missing_attributions.csv.zip、not_them_assertions.csv.zip、problem_collector_dates.csv.zip、users.csv.zip、users_unresolved.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:包含标本采集者与鉴定者的引用、缺失归属、存疑断言、日期问题、用户信息等关联数据,具体字段需参考压缩包内CSV文件结构
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:84928441-f3c6-41b3-8393-ee4090086826)
适用场景
- 生物标本数据关联分析: 用于研究NGCPR数字标本馆中采集者与鉴定者的信息关联及归属情况
- 生物多样性元数据质量评估: 分析标本数据中采集者/鉴定者日期问题、缺失归属等质量问题
- 志愿者标注数据研究: 探索Bionomia平台志愿者标注的标本关联数据特征与应用价值
- 数字标本馆数据管理优化: 为NGCPR数字标本馆的采集者与鉴定者信息管理提供数据支持