数据集概述
本数据集为美洲天牛科(Coleoptera: Cerambycidae)标本的采集者与鉴定者关联数据,基于GBIF聚合的标本数据,由Bionomia志愿者标注生成。包含9个文件,涉及标本记录、文献引用、用户信息及数据质量问题记录,支持生物分类学研究中采集者与鉴定者信息的关联分析。
文件详解
- 数据文件包配置
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包配置文件,定义数据集元数据及各数据文件的结构描述
- 核心数据文件(压缩包格式)
- 文件名称:citations.csv.zip、users.csv.zip、occurrences.csv.zip、articles.csv.zip、attributions.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:包含标本记录(occurrences)、文献引用(citations)、用户信息(users)、文献文章(articles)及采集者/鉴定者归属(attributions)等核心数据
- 数据质量问题文件(压缩包格式)
- 文件名称:problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip、not_them_assertions.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:记录鉴定者日期问题、采集者日期问题及非关联断言等数据质量相关信息
数据来源
Global Biodiversity Information Facility(GBIF)、Bionomia(志愿者Scribes标注)
适用场景
- 生物分类学研究: 分析美洲天牛科标本的采集者与鉴定者关联关系,支持分类学文献追溯
- 生物多样性数据质量评估: 基于问题数据文件,优化标本采集/鉴定日期及关联信息的准确性
- 采集者/鉴定者网络分析: 通过用户信息与归属数据,研究天牛科分类学研究群体的协作网络
- 标本数据标准化: 结合Frictionless Data包配置,推动生物标本数据的标准化共享与复用