数据集概述
本数据集是Santander BIO项目中El Carmen de Chucurí市两栖爬行动物标本的采集者与鉴定者关联数据,由志愿者在Bionomia平台标注生成,基于GBIF聚合的标本数据,包含标本采集、鉴定及相关文献等信息,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 核心数据文件
- 文件名称:citations.csv.zip、articles.csv.zip、attributions.csv.zip、occurrences.csv.zip、users.csv.zip
- 文件格式:CSV压缩包(ZIP)
- 字段映射介绍:包含标本采集者、鉴定者的关联信息,标本采集记录、文献引用、用户标注等数据字段
- 问题数据文件
- 文件名称:not_them_assertions.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:CSV压缩包(ZIP)
- 字段映射介绍:记录标注过程中识别的采集者/鉴定者身份存疑、日期信息异常等问题数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准,描述数据集的元数据信息,包括文件清单、数据结构等
数据来源
Bionomia平台(数据集ID:987ccc8c-4257-446c-b125-57960ebb69a7)、Global Biodiversity Information Facility(数据集ID:987ccc8c-4257-446c-b125-57960ebb69a7)
适用场景
- 生物标本数据管理:用于整理两栖爬行动物标本的采集者、鉴定者关联信息,完善标本元数据
- 生物多样性研究:支持分析El Carmen de Chucurí市两栖爬行动物的采集历史、鉴定人员网络等
- 标本数据质量控制:通过问题数据文件识别并修正标本采集/鉴定信息中的异常记录
- 公民科学项目评估:研究志愿者在Bionomia平台对标本数据的标注贡献与质量