数据集概述
本数据集包含与Tarantula属(Tapinauchenius、Psalmopoeus、Amazonius)分类修订及系统发育分析相关的采集者和鉴定者关联数据,由Bionomia志愿者标注生成,基于GBIF聚合的标本数据。数据集以Frictionless Data包格式组织,包含9个文件,涵盖标本记录、文献引用、用户信息及问题数据等内容。
文件详解
- 核心数据文件
- 文件名称:occurrences.csv.zip、citations.csv.zip、articles.csv.zip、users.csv.zip、attributions.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:包含标本记录、文献引用、相关文章、用户信息及采集者/鉴定者归属信息等核心数据
- 问题数据文件
- 文件名称:problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:记录采集者/鉴定者日期问题数据及非归属断言信息
- 数据描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的元数据描述文件,包含数据集结构、文件清单等信息
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:4a42eedd-7b6a-4c9e-8889-90bb8c8bd032),由Bionomia志愿者标注生成
适用场景
- 蜘蛛分类学研究: 支持Tarantula属分类修订及系统发育分析,关联标本采集者与鉴定者信息
- 生物多样性数据整合: 用于GBIF标本数据与采集者/鉴定者信息的关联分析
- 分类学数据质量评估: 通过问题数据文件分析标本记录中的日期错误等质量问题
- 生物标本数据标准化研究: 基于Frictionless Data包格式探索生物多样性数据的标准化组织方式