数据集概述
本数据集为“Araneae Collection”(蜘蛛标本集合)的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含9个文件,支持生物标本采集鉴定信息的关联分析。
文件详解
- 核心数据文件(压缩包格式)
- 文件名称:citations.csv.zip、not_them_assertions.csv.zip、users.csv.zip、problem_determiner_dates.csv.zip、articles.csv.zip、attributions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip
- 文件格式:CSV压缩包(.zip)
- 字段映射介绍:分别包含文献引用、否定关联声明、用户信息、鉴定者日期问题记录、文献文章、归属信息、标本记录、采集者日期问题记录等关联数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准,记录数据集的元数据信息,包括文件清单、格式规范等
数据来源
Bionomia平台(数据集ID:41103800-0e2e-11de-b8e6-b8a03c50a862),基于Global Biodiversity Information Facility(GBIF)聚合的标本数据
适用场景
- 生物标本采集网络分析:通过采集者与鉴定者的关联数据,研究蜘蛛标本采集活动的协作网络与人员关系
- 分类学历史研究:利用鉴定者信息追溯蜘蛛分类学研究的发展脉络与关键贡献者
- 标本数据质量控制:通过问题日期记录文件,识别并修正采集、鉴定日期的错误信息
- 生物多样性数据关联应用:将标本数据与采集者、鉴定者信息关联,丰富生物多样性数据库的元数据维度