数据集概述
本数据集为“Drammensfjord recolonization study”(德拉门峡湾再殖民化研究)关联的自然历史标本数据,包含标本与采集者、鉴定者的关联信息。数据由志愿者在Bionomia平台标注,基于Global Biodiversity Information Facility(GBIF)聚合的标本数据集,采用Frictionless Data数据包格式,共9个文件。
文件详解
- 核心数据文件
- 文件名称:citations.csv.zip、occurrences.csv.zip、articles.csv.zip、attributions.csv.zip、users.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:包含标本相关的引用、出现记录、文献、采集者/鉴定者归属及用户信息等关联数据
- 问题数据文件
- 文件名称:problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:记录采集者日期、鉴定者日期的问题数据及非关联断言信息
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,定义数据集结构与属性
数据来源
Bionomia平台(由志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合的标本数据集(数据集ID:75969a1c-4ab3-4cd5-b44b-a9650f177fe9)
适用场景
- 生物多样性研究:分析Drammensfjord区域标本的采集者、鉴定者关联信息,支撑再殖民化研究
- 标本数据质量评估:通过问题数据文件识别采集/鉴定日期等数据错误,优化标本数据质量
- 生物标本管理:为自然历史标本的采集者、鉴定者归属管理提供结构化数据支持
- 生物信息学分析:整合GBIF标本数据与Bionomia关联信息,开展生物多样性信息学研究