数据集概述
本数据集为SORO标本馆(Herbário do Centro de Ciências e Tecnologias para a Sustentabilidade)的自然历史标本关联数据,包含标本与采集者、鉴定者的关联信息,由Bionomia平台志愿者标注,基于GBIF聚合的标本数据,采用Frictionless Data数据包格式组织。
文件详解
- 数据文件包描述文件:datapackage.json,JSON格式,用于描述数据集的Frictionless Data数据包结构与元信息
- 引用数据文件:citations.csv.zip,ZIP格式,包含标本相关的引用信息
- 鉴定者日期问题数据文件:problem_determiner_dates.csv.zip,ZIP格式,记录鉴定者日期存在问题的标本数据
- 用户数据文件:users.csv.zip,ZIP格式,包含参与标注的志愿者用户信息
- 归属信息数据文件:attributions.csv.zip,ZIP格式,记录标本数据的归属与标注信息
- 标本记录数据文件:occurrences.csv.zip,ZIP格式,包含标本的基本记录信息
- 排除关联数据文件:not_them_assertions.csv.zip,ZIP格式,记录已排除的错误关联信息
- 采集者日期问题数据文件:problem_collector_dates.csv.zip,ZIP格式,记录采集者日期存在问题的标本数据
- 文献数据文件:articles.csv.zip,ZIP格式,包含与标本相关的文献信息
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号e1278068-7d2d-44e0-8274-a46ae6ebf957)、Bionomia平台志愿者标注
适用场景
- 生物标本馆数据管理: 用于SORO标本馆标本采集者、鉴定者信息的关联与整理
- 生物多样性研究: 支持基于标本采集者、鉴定者信息的生物多样性分布分析
- 标本数据质量控制: 利用日期问题数据文件优化标本元数据质量
- 公民科学项目研究: 分析Bionomia平台志愿者标注的标本数据归属模式