数据集概述
本数据集为CardObs自然观察数据中与采集者和鉴定者关联的自然历史标本数据,由Bionomia志愿者Scribes基于Global Biodiversity Information Facility聚合的CardObs数据集生成,包含采集者、鉴定者关联信息及相关问题数据,采用Frictionless Data包格式,共9个文件。
文件详解
- 数据文件
- 文件名称:citations.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、articles.csv.zip、users.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩为ZIP格式)
- 字段映射介绍:包含自然历史标本的采集者、鉴定者关联信息、引用数据、标本出现记录、采集者/鉴定者日期问题数据、归属断言、用户信息等内容
- 描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的描述文件,包含数据集的元数据信息
数据来源
Global Biodiversity Information Facility(数据集编号:818b61fe-8c37-4c49-83f8-fa710cfdbb81),由Bionomia志愿者Scribes生成
适用场景
- 生物多样性研究:分析自然历史标本的采集者与鉴定者关联信息,支持生物多样性分布及演化研究
- 标本数据质量控制:通过problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip等文件识别并修正采集者/鉴定者日期问题
- 科学贡献归因:利用attributions.csv.zip等文件明确自然历史标本数据中采集者与鉴定者的贡献归属
- 生物信息学数据整合:基于Frictionless Data包格式,支持与其他生物多样性数据集的整合分析