数据集概述
本数据集是加州大学与杰普森植物标本馆维管植物标本的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,原始标本数据来自全球生物多样性信息网络(GBIF)聚合的数据集。数据以Frictionless Data数据包格式组织,包含9个文件,涵盖标本记录、采集者/鉴定者信息、标注归属及数据质量问题记录等内容。
文件详解
- 文件名称:
citations.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:未提供具体字段信息,推测包含标本相关文献引用数据
- 文件名称:
occurrences.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:未提供具体字段信息,推测包含维管植物标本的 occurrence 记录数据
- 文件名称:
attributions.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:未提供具体字段信息,推测包含志愿者标注归属信息
- 文件名称:
problem_determiner_dates.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:未提供具体字段信息,推测包含鉴定者日期存在问题的标本记录
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包描述文件,包含数据集元数据信息
- 文件名称:
users.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:未提供具体字段信息,推测包含参与标注的志愿者用户数据
- 文件名称:
problem_collector_dates.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:未提供具体字段信息,推测包含采集者日期存在问题的标本记录
- 文件名称:
articles.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:未提供具体字段信息,推测包含与标本相关的学术文章数据
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:未提供具体字段信息,推测包含标注为“非该采集者/鉴定者”的断言记录
数据来源
Bionomia平台志愿者标注数据,原始标本数据来自全球生物多样性信息网络(GBIF)聚合的数据集(数据集ID:83a49751-4282-481e-a847-1c5c224a0551)
适用场景
- 植物标本馆数据质量评估:分析采集者/鉴定者日期存在的问题,优化标本记录质量
- 生物多样性研究:整合维管植物标本的采集者、鉴定者及 occurrence 数据,支持植物区系分布研究
- 公民科学贡献分析:通过标注归属数据,研究志愿者在生物标本数据整理中的贡献模式
- 植物分类学历史研究:利用采集者与鉴定者关联数据,追溯维管植物分类学研究的历史脉络