数据集概述
本数据集为论文“Three New South African Embrithini (Coleoptera: Curculionidae: Entiminae)”关联的自然历史标本数据,包含标本与采集者、鉴定者的关联信息。数据由Bionomia志愿者标注,基于GBIF聚合的标本数据集,采用Frictionless Data数据包格式,共9个文件。
文件详解
- 核心数据文件
- 文件名称:occurrences.csv.zip、citations.csv.zip、articles.csv.zip
- 文件格式:ZIP压缩包(CSV)
- 字段映射介绍:包含标本 occurrence 记录、文献引用、关联文章等基础信息
- 关联属性文件
- 文件名称:attributions.csv.zip、users.csv.zip
- 文件格式:ZIP压缩包(CSV)
- 字段映射介绍:记录Bionomia志愿者的标注归属、用户信息
- 问题数据文件
- 文件名称:problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip
- 文件格式:ZIP压缩包(CSV)
- 字段映射介绍:包含采集者/鉴定者日期问题记录、非目标关联声明
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件
数据来源
Global Biodiversity Information Facility(GBIF)数据集(73bb1259-a607-4359-ac8c-ebeea4e1ea6e)、Bionomia平台志愿者标注
适用场景
- 生物分类学研究:支持南非Embrithini亚科新物种的标本溯源与分类验证
- 标本数据质量评估:分析采集者/鉴定者日期问题,优化标本元数据质量
- 生物多样性数据关联:整合GBIF与Bionomia数据,完善自然历史标本的人员关联网络
- 分类学文献计量:通过citations.csv和articles.csv分析相关研究的文献引用关系
- 公民科学贡献研究:基于attributions.csv和users.csv研究志愿者在生物标本数据标注中的贡献模式