数据集概述
本数据集为亚马逊国家研究所(INPA)Ortopthera Collection标本数据与采集者、鉴定者的关联信息,由Bionomia志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据,采用Frictionless Data数据包格式,包含9个文件,支持生物标本数据的关联分析与溯源。
文件详解
- 数据文件包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的描述文件,包含数据集的元数据信息
- 标本关联数据文件
- 文件名称:citations.csv.zip、articles.csv.zip、occurrences.csv.zip、users.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip
- 文件格式:CSV(压缩为ZIP格式)
- 字段映射介绍:包含标本采集者、鉴定者的关联信息、标注归属、问题日期记录、用户信息等关联数据,具体字段需解压后查看原始CSV文件
数据来源
Bionomia平台(由志愿者Scribes标注),基于全球生物多样性信息机构(GBIF)聚合的INPA Ortopthera Collection标本数据(数据集ID:0226cfa0-2284-4dbf-be05-cad350f50b61)
适用场景
- 生物标本数据溯源:分析Ortopthera Collection标本的采集者、鉴定者信息,实现标本数据的溯源与验证
- 生物多样性研究:关联标本数据与采集者、鉴定者信息,支持生物多样性分布与采集历史的研究
- 标本数据质量控制:通过problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip文件分析标本数据中的日期问题,提升数据质量
- 志愿者标注行为分析:基于users.csv.zip、attributions.csv.zip文件研究Bionomia平台志愿者的标注行为与贡献模式