数据集概述
本数据集关联了《西非Saraina属(蜘蛛目,跳蛛科)综述》中的自然历史标本数据与采集者、鉴定者信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集,以Frictionless Data数据包格式组织,包含九份文件,用于支撑跳蛛分类学研究中的标本归属分析。
文件详解
- 压缩文件包(共8个)
- 文件名称:citations.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip、problem_collector_dates.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、articles.csv.zip、occurrences.csv.zip
- 文件格式:ZIP(内含CSV文件)
- 字段映射介绍:分别对应引文信息、鉴定者日期问题记录、用户信息、采集者日期问题记录、归属信息、非关联声明、文献信息、标本 occurrence 数据的结构化表格
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准的数据包元数据,包含数据集基本信息、文件清单及结构定义
数据来源
Bionomia平台(数据集ID:40966a99-5bdf-4603-8384-85f6c66b2390),原始标本数据来自全球生物多样性信息设施(GBIF,数据集ID:40966a99-5bdf-4603-8384-85f6c66b2390)
适用场景
- 跳蛛分类学研究: 关联标本与采集者、鉴定者信息,支撑西非Saraina属的分类修订与物种分布分析
- 生物标本数据标准化: 分析采集者/鉴定者信息的标注问题(如日期错误),优化标本元数据质量
- 生物多样性数据溯源: 通过归属信息追踪标本数据的来源与标注过程,提升分类学研究的可重复性
- 志愿者标注行为分析: 基于users.csv.zip与attributions.csv.zip,研究Bionomia平台志愿者参与生物标本数据整理的模式