数据集概述
本数据集为菲尔德自然历史博物馆植物学部真菌标本馆的标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据集,采用Frictionless Data数据包格式组织,包含9个文件。
文件详解
- 核心数据文件
- 文件名称:
occurrences.csv.zip、citations.csv.zip、attributions.csv.zip、users.csv.zip、articles.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:包含真菌标本的采集记录、文献引用、人员归属、用户信息及相关文献等结构化数据
- 问题数据文件
- 文件名称:
problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:记录采集者/鉴定者日期异常数据、非目标人员标注数据等问题记录
- 数据包描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,定义数据集结构、字段及格式规范
数据来源
Bionomia平台(数据集ID:81e6cff2-b409-417e-8c72-e1bbafb7c61f),原始标本数据来自Global Biodiversity Information Facility(GBIF,数据集ID:81e6cff2-b409-417e-8c72-e1bbafb7c61f)
适用场景
- 生物多样性标本数据关联分析:整合真菌标本与采集者、鉴定者的关联信息,支撑标本溯源研究
- 真菌分类学历史研究:通过采集者与鉴定者数据,分析真菌分类学研究的历史脉络与人员网络
- 标本数据质量评估:利用问题数据文件,识别并修正标本记录中的日期、人员标注错误
- 生物多样性开放数据标准化:基于Frictionless Data格式,推动真菌标本数据的标准化共享与复用