数据集概述
本数据集包含NEON域步甲教学标本的采集者与鉴定者关联数据,由志愿者通过Bionomia平台基于GBIF聚合的标本数据生成,采用Frictionless Data数据包格式,包含9个文件,用于记录标本相关的归属声明、采集者与鉴定者信息等内容。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,定义数据集的结构、文件清单及相关描述信息
- 归属声明文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含Bionomia平台上志愿者对标本数据的归属声明信息
- 标本发生数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录步甲标本的发生记录信息
- 非归属声明文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含非归属声明的相关数据
- 引用文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本数据相关的引用信息
- 文章关联文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:与标本相关的文章关联数据
- 采集者日期问题文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录采集者日期存在问题的相关数据
- 鉴定者日期问题文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录鉴定者日期存在问题的相关数据
- 用户信息文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含参与数据标注的用户相关信息
数据来源
Bionomia平台志愿者标注,基于Global Biodiversity Information Facility(GBIF)聚合的数据集(编号:69e5ceb4-30a6-4074-8f9d-d6a0457cb789)
适用场景
- 生物标本数据管理:用于整理和关联步甲教学标本的采集者、鉴定者信息,完善标本元数据
- 生物多样性研究:支持基于标本数据的生物多样性分布、物种鉴定历史等分析
- 科学数据溯源:通过归属声明和引用数据,追溯标本数据的来源和标注过程
- 数据质量评估:利用日期问题文件分析标本采集、鉴定日期记录的质量问题,优化数据采集流程