数据集概述
本数据集为双翅目实蝇科Neoceratitis Hendel属分类修订相关的自然历史标本数据,包含与采集者、鉴定者关联的标本信息,由Bionomia志愿者标注,基于GBIF聚合的标本数据,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,包含数据集基本信息、资源列表等
- 标本核心数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含Neoceratitis属标本的核心记录信息
- 采集者日期问题数据文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:记录采集者日期存在问题的标本数据
- 鉴定者日期问题数据文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:记录鉴定者日期存在问题的标本数据
- 引用数据文件
- 文件名称:citations.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含标本相关的引用信息
- 文章数据文件
- 文件名称:articles.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含与标本相关的文献文章信息
- 用户数据文件
- 文件名称:users.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含标注相关的用户信息
- 归属声明数据文件
- 文件名称:attributions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含标本数据的归属声明信息
- 排除声明数据文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含标注为“非该主体”的声明信息
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:5d0783f4-d489-459b-8f24-eda1ba7dcec5)、Bionomia平台(https://bionomia.net/dataset/5d0783f4-d489-459b-8f24-eda1ba7dcec5)
适用场景
- 生物分类学研究:支持Neoceratitis Hendel属的分类修订与系统发育分析
- 标本数据标准化:用于评估和优化标本采集、鉴定信息的标准化记录
- 生物多样性信息学:为生物多样性数据整合、关联分析提供基础数据
- 分类学历史研究:通过采集者、鉴定者关联数据,研究分类学研究的历史脉络
- 数据质量评估:利用问题日期数据,开展标本元数据质量控制方法研究