数据集概述
本数据集为美国德雷塞尔大学自然科学院(ANSP)苔藓植物标本收藏全部标本的采集者与鉴定者归属信息,由Bionomia志愿者基于GBIF聚合数据(数据集ID: 039c9aba-2f77-4001-a72a-40b9fa830ab4)逐一核对并关联,共覆盖约15万份苔藓标本。以Frictionless Data Package格式发布,共9个文件,是全球最大的苔藓标本归属数据集之一。
文件详解
- datapackage.json:Frictionless元数据描述文件
- occurrences.csv.zip:GBIF原始标本记录
- attributions.csv.zip:核心归属表(标本ID ↔ 采集者/鉴定者ORCID/Wikidata QID)
- citations.csv.zip & articles.csv.zip:文献引用与论文信息
- problem_collector_dates.csv.zip & problem_determiner_dates.csv.zip:日期冲突标本清单
- not_them_assertions.csv.zip:排除归属声明
- users.csv.zip:参与整理的Bionomia志愿者信息
数据来源
Bionomia(https://bionomia.net/dataset/039c9aba-2f77-4001-a72a-40b9fa830ab4)
Global Biodiversity Information Facility(GBIF)聚合的ANSP苔藓植物数据集
适用场景
- 苔藓植物分类学研究:准确致谢历史采集者与鉴定者,提升新种描述论文规范性
- 博物馆标本数字化质量提升:批量修正GBIF中采集/鉴定人字段缺失或错误记录
- 科学贡献史分析:追溯19-20世纪著名苔藓学家(如Holzinger、Bartram)在北美苔藓研究中的贡献
- 生物多样性信息学示范:Bionomia + Frictionless工作流在植物标本数据清洗中的最佳实践
- 教学与公众科学:支持苔藓学课程与公民科学项目使用