数据集概述
本数据集为安蒂奥基亚理工学院昆虫收藏(CETdeA)中丽蝇科(双翅目)昆虫标本的采集者与鉴定者关联数据,由志愿者通过Bionomia平台基于全球生物多样性信息设施(GBIF)聚合的标本数据生成,包含标本采集、鉴定相关的归属信息及问题记录,以Frictionless Data数据包格式组织,共十一个文件。
文件详解
- 压缩文件(共10个,格式为ZIP)
- 文件名:citations.csv.zip、articles.csv.zip、not_them_assertions.csv.zip、users.csv.zip、missing_attributions.csv.zip、users_unresolved.csv.zip、attributions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip
- 内容说明:分别包含引用信息、文献文章、非归属声明、用户信息、缺失归属记录、未解析用户、归属数据、标本 occurrence 信息、采集日期问题记录等CSV格式数据
- 数据包描述文件
- 文件名:datapackage.json
- 文件格式:JSON
- 内容说明:Frictionless Data数据包的元数据文件,定义数据集结构、文件清单及相关描述
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号310714fe-57a1-4cc2-9689-69471bd289ea),由Bionomia平台志愿者生成归属信息
适用场景
- 昆虫分类学研究:分析丽蝇科标本的采集者、鉴定者网络及历史分类记录
- 生物标本管理:优化CETdeA昆虫收藏的采集者与鉴定者关联数据质量
- 生物多样性数据整合:补充GBIF聚合数据中的标本归属元数据
- 科学贡献者归因研究:探索自然历史标本数据中采集者、鉴定者的贡献记录模式
- 数据质量评估:基于problem_collector_dates等文件分析标本采集日期的记录问题