数据集概述
本数据集为南锡霍特-阿林地区步甲(Caraboidea)标本的采集者与鉴定者关联数据,由Bionomia志愿者标注生成,基于GBIF聚合的标本数据。数据以Frictionless Data数据包格式组织,包含9个文件,涵盖标本关联信息、文献引用、问题日期记录等内容,用于生物多样性标本数据的溯源与关联分析。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,定义数据集的结构、文件清单及相关描述信息
- 压缩数据文件(共8个)
- 文件名称:citations.csv.zip、attributions.csv.zip、users.csv.zip、articles.csv.zip、problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:包含标本与采集者/鉴定者的关联信息、文献引用数据、用户信息、问题日期记录、排除断言及标本 occurrence 数据等内容
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:f0633e1c-1b2d-4d80-b881-065e5de44897);Bionomia平台(https://bionomia.net/dataset/f0633e1c-1b2d-4d80-b881-065e5de44897)
适用场景
- 生物标本数据溯源研究: 分析步甲标本采集者与鉴定者的关联关系,实现标本数据的来源追溯
- 生物多样性数据整合: 关联GBIF标本数据与Bionomia标注信息,支持跨平台生物多样性数据的整合分析
- 标本采集历史研究: 基于采集者与鉴定者的时间记录,研究南锡霍特-阿林地区步甲标本的采集历史脉络
- 生物分类学数据质量控制: 利用问题日期记录等数据,识别并修正标本数据中的时间标注错误
- 志愿者标注贡献分析: 通过用户信息文件,分析Bionomia平台志愿者对生物标本数据标注的贡献情况