数据集概述
本数据集为路易斯安那州立大学雪莉·C·塔克植物标本馆维管植物的标本数据,关联了标本的采集者与鉴定者信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息 facility 聚合的标本数据集,以Frictionless Data数据包格式组织,包含9个文件。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,描述数据集的结构、资源等信息
- 标本数据文件(压缩包)
- 文件名称:occurrences.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:维管植物标本的核心记录数据
- 引用数据文件(压缩包)
- 文件名称:citations.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本相关的引用信息
- 文章数据文件(压缩包)
- 文件名称:articles.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:与标本相关的文献文章信息
- 鉴定者日期问题数据文件(压缩包)
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:鉴定者日期存在问题的记录数据
- 采集者日期问题数据文件(压缩包)
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:采集者日期存在问题的记录数据
- 归属数据文件(压缩包)
- 文件名称:attributions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本采集者与鉴定者的归属标注信息
- 排除标注数据文件(压缩包)
- 文件名称:not_them_assertions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标注为“非该人员”的排除记录数据
- 用户数据文件(压缩包)
- 文件名称:users.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:参与标注的用户信息数据
数据来源
Bionomia平台(由志愿者标注),基于Global Biodiversity Information Facility聚合的数据集(数据集ID:56e9c560-bd2a-11dd-b15e-b8a03c50a862)
适用场景
- 生物标本馆数据标准化:用于植物标本馆采集者、鉴定者信息的关联与标准化整理
- 生物多样性研究:支撑维管植物标本的采集历史、鉴定信息分析,辅助生物多样性分布研究
- 标本数据质量控制:利用问题日期数据文件,开展标本元数据的质量核查与清洗
- 公民科学贡献分析:通过用户数据与归属数据,研究志愿者在生物标本数据标注中的贡献模式
- 植物分类学研究:结合标本记录与文献数据,辅助维管植物分类学的历史回溯与验证