数据集概述
本数据集为CABI鳞翅目标本集的关联数据,包含标本与采集者、鉴定者的链接关系,由Bionomia志愿者标注生成,基于全球生物多样性信息设施(GBIF)聚合的标本数据。数据集采用Frictionless Data包格式,共含9个文件,核心为压缩文件与JSON描述文件,支持生物标本元数据的查询与分析。
文件详解
- 数据文件包描述
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的描述文件,定义数据集的元数据、文件列表及结构规范
- 压缩数据文件
- 文件名称:citations.csv.zip、attributions.csv.zip、articles.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、not_them_assertions.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含标本引用、属性标注、文献关联、标本记录、采集日期问题记录、鉴定者排除声明、鉴定日期问题记录、用户信息等分类数据
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF)
适用场景
- 生物标本元数据整合: 关联CABI鳞翅目标本与采集者、鉴定者信息,完善标本记录维度
- 生物多样性研究: 分析鳞翅目标本的采集分布、鉴定历史及相关文献关联
- 标本数据质量控制: 利用日期问题记录文件优化采集与鉴定时间的准确性
- 公民科学项目分析: 研究Bionomia志愿者标注的标本属性数据价值与应用场景