数据集概述
本数据集为日本海洋研究开发机构(JAMSTEC)海洋生物样本数据库中与采集者和鉴定者关联的自然历史标本数据。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据生成,采用Frictionless Data数据包格式,包含9个文件。
文件详解
- 数据文件包配置
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的配置文件,定义数据集的元数据信息
- 核心数据文件(压缩包格式)
- 文件名称:citations.csv.zip、not_them_assertions.csv.zip、attributions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、articles.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip
- 文件格式:ZIP(内含CSV文件)
- 字段映射介绍:包含海洋生物标本的采集者、鉴定者关联信息,涉及引用、断言、归属、出现记录、日期问题、文献、用户等相关数据维度
数据来源
日本海洋研究开发机构(JAMSTEC)海洋生物样本数据库,由Bionomia志愿者标注,基于全球生物多样性信息机构(GBIF)聚合数据
适用场景
- 海洋生物多样性研究: 分析海洋生物标本的采集者与鉴定者关联信息,支持生物多样性分布研究
- 标本数据质量控制: 利用日期问题文件(problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip)识别和修正标本数据中的时间维度错误
- 生物信息学元数据研究: 通过数据包配置文件和关联数据,探索自然历史标本数据的标准化组织方式
- 科学贡献者网络分析: 基于采集者与鉴定者的关联数据,构建海洋生物研究领域的科学贡献者合作网络
- 生物多样性数据整合: 作为GBIF聚合数据的补充,支持跨平台海洋生物样本数据的关联与整合分析