数据集概述
本数据集为双翅目昆虫标本数据库(Database_diptera)的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,原始标本数据来自全球生物多样性信息网络(GBIF)聚合的数据集,包含标本记录与人员的关联声明、归因信息及相关问题数据,采用Frictionless Data数据包格式组织。
文件详解
- 核心数据文件(ZIP格式)
- citations.csv.zip:引用信息数据文件,格式为CSV压缩包
- problem_determiner_dates.csv.zip:鉴定者日期问题数据文件,格式为CSV压缩包
- attributions.csv.zip:人员归因信息数据文件,格式为CSV压缩包
- occurrences.csv.zip:标本记录数据文件,格式为CSV压缩包
- problem_collector_dates.csv.zip:采集者日期问题数据文件,格式为CSV压缩包
- users.csv.zip:用户信息数据文件,格式为CSV压缩包
- not_them_assertions.csv.zip:非关联声明数据文件,格式为CSV压缩包
- articles.csv.zip:文献信息数据文件,格式为CSV压缩包
- 数据包描述文件
- datapackage.json:Frictionless Data数据包描述文件,格式为JSON,定义数据集元信息
数据来源
Global Biodiversity Information Facility(GBIF)聚合数据集(https://gbif.org/dataset/aa1df177-e42c-4313-b50c-ddda2422e193);Bionomia平台志愿者标注(https://bionomia.net/dataset/aa1df177-e42c-4313-b50c-ddda2422e193)
适用场景
- 生物标本数据标准化:用于双翅目昆虫标本记录中采集者、鉴定者信息的规范化关联与整合
- 生物多样性数据质量评估:通过日期问题数据(problem_determiner_dates、problem_collector_dates)分析标本元数据质量
- 生物分类学历史研究:基于人员归因信息追溯双翅目昆虫分类鉴定的历史脉络与研究者网络
- 公民科学数据应用:探索志愿者标注模式在生物多样性数据关联中的实践效果与优化方向