数据集概述
本数据集为IBGE标本馆(含虚拟标本馆REFLORA)的自然历史标本数据,包含标本与采集者、鉴定者的关联信息。数据由志愿者通过Bionomia平台标注,基于GBIF聚合的标本数据,以Frictionless Data数据包格式组织,共含9个文件,支持生物标本数据的关联分析与溯源。
文件详解
- 数据文件包
- 核心文件:
datapackage.json,JSON格式,为Frictionless Data数据包的描述文件,定义数据集的元数据
- 压缩数据文件:共8个ZIP格式文件,包括
citations.csv.zip(引用数据)、users.csv.zip(用户数据)、articles.csv.zip(文献数据)、problem_determiner_dates.csv.zip(鉴定者日期问题数据)、problem_collector_dates.csv.zip(采集者日期问题数据)、not_them_assertions.csv.zip(非本人声明数据)、attributions.csv.zip(归属数据)、occurrences.csv.zip(标本 occurrence 数据)
数据来源
Bionomia平台(志愿者标注),基于Global Biodiversity Information Facility(GBIF)聚合的IBGE标本馆数据集
适用场景
- 生物标本数据溯源: 分析标本采集者、鉴定者的关联信息,实现标本数据的来源追溯
- 生物多样性研究: 整合标本 occurrence 数据与采集者信息,支持物种分布及采集历史研究
- 标本馆数据质量评估: 利用日期问题数据(如problem_determiner_dates、problem_collector_dates)优化标本馆数据质量
- 生物分类学研究: 通过鉴定者归属数据,分析分类学研究的贡献者网络与历史脉络