数据集概述
本数据集包含柏林-达勒姆植物园和植物博物馆标本馆(B herbarium)与虚拟植物标本馆REFLORA的植物标本数据,关联了标本的采集者和鉴定者信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式呈现,共包含九个文件。
文件详解
- 数据文件包(Frictionless Data package)
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:数据集的元数据文件,包含数据包的描述、资源列表及模式信息
- 压缩文件(ZIP)
- 文件名称及内容:
- citations.csv.zip:引用数据
- problem_determiner_dates.csv.zip:鉴定者日期问题数据
- articles.csv.zip:文章数据
- attributions.csv.zip:归属数据
- users.csv.zip:用户数据
- not_them_assertions.csv.zip:非本人声明数据
- occurrences.csv.zip:标本记录数据
- problem_collector_dates.csv.zip:采集者日期问题数据
- 文件格式:ZIP压缩包,内含CSV文件
数据来源
Bionomia平台志愿者标注数据,基于全球生物多样性信息机构(GBIF)聚合的数据集(https://gbif.org/dataset/267f93fe-9f32-4770-909e-a751a1020957)
适用场景
- 生物多样性研究:分析植物标本的采集者和鉴定者信息,了解标本的采集历史和分类学背景
- 标本馆数据管理:整合和关联标本馆的采集者与鉴定者数据,提升标本数据的完整性和可用性
- 分类学研究:通过关联采集者和鉴定者信息,支持植物分类学的历史研究和文献追溯
- 志愿者贡献分析:研究Bionomia平台志愿者对生物多样性数据标注的贡献模式和质量
- 数据质量评估:利用问题日期数据,评估标本采集和鉴定日期记录的准确性和完整性