数据集概述
本数据集为阿根廷IIMyC-MDQ植物标本馆维管植物(石松类、蕨类、裸子植物、单子叶被子植物)标本的采集者与鉴定者关联数据。由Bionomia志愿者标注,基于GBIF聚合的标本数据,以Frictionless数据包格式组织,包含9个文件,支持生物多样性领域的标本信息追溯与研究。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,定义数据集结构、文件清单及数据规范
- 压缩数据文件(共8个ZIP格式文件)
- 文件名称:citations.csv.zip、problem_collector_dates.csv.zip、articles.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip、users.csv.zip、occurrences.csv.zip
- 文件格式:ZIP(内部为CSV)
- 字段映射介绍:包含标本采集者/鉴定者关联数据(attributions)、文献引用(citations)、标本记录(occurrences)、用户信息(users)、日期问题记录(problem_collector_dates/problem_determiner_dates)、非匹配声明(not_them_assertions)及相关文献(articles)
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合数据
适用场景
- 生物多样性标本溯源:通过采集者与鉴定者关联数据,追溯MDQ标本馆维管植物标本的采集与鉴定历史
- 植物分类学研究:分析标本鉴定者的分类工作分布,支持分类学文献与标本记录的关联分析
- 生物多样性数据质量评估:利用日期问题文件,识别并修正标本采集/鉴定日期的记录错误
- 志愿者贡献研究:通过用户信息文件,研究Bionomia平台志愿者参与生物多样性数据标注的模式
- 标本馆数据标准化:基于Frictionless数据包规范,为植物标本馆关联数据的标准化整理提供参考