数据集概述
本数据集为西班牙马拉加大学MGC标本馆藻类标本(MGC-Algae dataset)的采集者与鉴定者关联数据,由Bionomia志愿者基于全球生物多样性信息设施(GBIF)聚合的标本数据生成,采用Frictionless Data数据包格式,包含9个文件,涉及标本引用、分布、日期问题等关联信息。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的描述文件,包含数据集元数据信息
- 标本引用数据文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:藻类标本相关的引用信息数据
- 标本分布数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:藻类标本的分布信息数据
- 排除断言数据文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:关于标本采集者或鉴定者的排除断言信息
- 采集者日期问题数据文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:存在问题的采集者日期相关信息
- 鉴定者日期问题数据文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:存在问题的鉴定者日期相关信息
- 文章数据文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:与藻类标本相关的文章信息数据
- 归属信息数据文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本采集者与鉴定者的归属关联信息
- 用户数据文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与数据处理的用户相关信息
数据来源
Bionomia志愿者基于全球生物多样性信息设施(GBIF)数据集(https://gbif.org/dataset/962e2f2e-f762-11e1-a439-00145eb45e9a)生成
适用场景
- 生物标本馆数据管理: 用于整理和完善MGC标本馆藻类标本的采集者与鉴定者关联信息
- 生物多样性研究: 支持藻类标本相关的生物多样性分布、采集历史等研究
- 标本数据质量控制: 利用日期问题数据文件优化标本采集与鉴定日期的记录质量
- 科学贡献归因分析: 通过归属信息数据研究标本采集者与鉴定者的科学贡献