数据集概述
本数据集为奥斯陆大学昆虫学标本的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据。数据以Frictionless Data数据包格式组织,包含11个文件,主要记录标本与采集者、鉴定者的关联信息及相关问题数据,支持生物标本元数据的关联分析。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,包含数据集基本信息、文件清单及数据规范定义
- 关联信息文件
- 文件名称:attributions.csv.zip、citations.csv.zip、users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本与采集者/鉴定者的关联归因、引用信息及相关用户数据
- 问题数据文件
- 文件名称:problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip、users_unresolved.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录采集者/鉴定者日期问题、非本人标注断言及未解析用户信息等问题数据
- 文献关联文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:与标本关联的文献数据
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF数据集ID:26f5b360-8770-4d54-9c2d-397798a5e513)
适用场景
- 生物标本元数据关联分析: 研究昆虫标本与采集者、鉴定者的关联关系,完善标本元数据
- 生物多样性数据质量评估: 分析采集者/鉴定者信息中的日期问题、未解析用户等数据质量问题
- 自然历史标本数字化研究: 支持昆虫标本数字化过程中的采集者与鉴定者信息标准化处理
- 生物分类学研究辅助: 为昆虫分类学研究提供标本采集者、鉴定者及关联文献的参考数据