数据集概述
本数据集包含塞内加尔濒危植物标本的采集者与鉴定者关联信息,基于IFAN标本馆的濒危植物标本数据,由志愿者通过Bionomia平台标注关联关系,数据来源于GBIF聚合的标本数据集,以Frictionless Data数据包格式组织,包含9个文件。
文件详解
- 核心数据文件
- 文件名称:citations.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、articles.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip
- 文件格式:ZIP(压缩包)
- 字段映射介绍:分别包含引用信息、关联归属信息、非关联声明、相关文献、标本 occurrence 数据、采集者日期问题记录、鉴定者日期问题记录及用户信息的结构化数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,包含数据集基本信息、文件清单及数据结构定义
数据来源
Bionomia平台(数据集ID:31a29499-0189-4c72-975b-eede9114d550)、Global Biodiversity Information Facility(GBIF,数据集ID:31a29499-0189-4c72-975b-eede9114d550)
适用场景
- 生物多样性标本数据标准化: 用于规范濒危植物标本采集者与鉴定者信息的关联与标注
- 植物标本历史溯源研究: 通过采集者、鉴定者关联数据追溯塞内加尔濒危植物标本的采集背景与分类鉴定过程
- 标本数据质量评估: 分析problem_collector_dates、problem_determiner_dates中的日期问题,优化标本元数据质量
- 生物多样性信息学研究: 探索标本数据关联网络在生物多样性大数据整合中的应用价值