数据集概述
本数据集为“Base de datos del género Salvia, del herbario Kew, primera parte”中植物标本与采集者、鉴定者的关联数据。数据由志愿者通过Bionomia标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据生成,包含标本记录、采集者与鉴定者关联、问题日期记录等内容,以Frictionless Data包格式组织,共九个文件。
文件详解
- 归档文件(.zip格式,共8个)
- 文件名称:citations.csv.zip、occurrences.csv.zip、not_them_assertions.csv.zip、problem_collector_dates.csv.zip、articles.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip
- 文件格式:ZIP(包含CSV文件)
- 字段映射介绍:分别存储标本引用数据、标本记录数据、非关联声明数据、采集者日期问题数据、文献数据、归属数据、鉴定者日期问题数据、用户数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准,描述数据集的元数据信息
数据来源
Bionomia(志愿者标注)、Global Biodiversity Information Facility(GBIF)
适用场景
- 植物分类学研究:分析Salvia属标本的采集者与鉴定者关联信息,支持分类修订与标本溯源
- 生物多样性数据整合:为GBIF等平台的Salvia属标本数据补充采集者与鉴定者元数据
- 标本数据质量评估:通过问题日期记录(采集者/鉴定者)识别标本数据中的时间维度错误
- 植物标本库管理优化:为Kew标本库等机构的标本管理系统提供关联数据参考,提升数据完整性