数据集概述
本数据集为马格达莱纳大学生物收藏中心半翅目昆虫标本的采集者与鉴定者关联数据,由志愿者通过Bionomia平台基于GBIF聚合的标本数据构建,包含标本记录、人员关联、文献引用等结构化信息,以Frictionless Data数据包格式组织,共11个文件。
文件详解
- 核心数据文件(.zip格式)
- citations.csv.zip:文献引用数据压缩包
- users.csv.zip:用户信息数据压缩包
- attributions.csv.zip:人员归属关联数据压缩包
- problem_collector_dates.csv.zip:采集日期异常数据压缩包
- not_them_assertions.csv.zip:非本人关联声明数据压缩包
- occurrences.csv.zip:标本记录数据压缩包
- articles.csv.zip:相关文献数据压缩包
- missing_attributions.csv.zip:缺失归属数据压缩包
- 数据包描述文件
- datapackage.json:Frictionless Data数据包的元数据描述文件,定义数据结构与格式
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:e330e2ff-9816-482e-aceb-27f2b3cc05c4),由Bionomia平台志愿者标注生成
适用场景
- 生物标本数据管理:用于整理半翅目昆虫标本的采集者、鉴定者关联信息,完善标本元数据
- 生物多样性研究:通过标本记录与人员关联数据,分析昆虫标本的采集历史与分布特征
- 科学贡献追溯:基于归属数据追溯标本采集与鉴定的科学贡献者信息
- 数据质量校验:利用异常数据文件识别标本记录中的日期、人员关联等质量问题