数据集概述
本数据集为萨尔茨堡大学馆藏的自然历史标本数据,包含标本与采集者、鉴定者的关联信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据集,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 数据文件列表(共9个,均为.zip或.json格式):
citations.csv.zip:引用信息文件,ZIP格式
occurrences.csv.zip:标本 occurrence 信息文件,ZIP格式
articles.csv.zip:相关文献文章信息文件,ZIP格式
attributions.csv.zip:归属信息文件,ZIP格式
not_them_assertions.csv.zip:非关联声明文件,ZIP格式
problem_collector_dates.csv.zip:采集者日期问题文件,ZIP格式
problem_determiner_dates.csv.zip:鉴定者日期问题文件,ZIP格式
users.csv.zip:用户信息文件,ZIP格式
datapackage.json:数据包装描述文件,JSON格式,用于定义数据包结构
数据来源
Bionomia平台(志愿者标注),原始标本数据来自Global Biodiversity Information Facility(GBIF)数据集(编号82746a3e-f762-11e1-a439-00145eb45e9a)
适用场景
- 生物标本溯源研究:分析标本采集者、鉴定者的关联信息,追溯标本历史记录
- 生物多样性数据整合:支持GBIF标本数据与人员信息的关联整合
- 标本数据质量评估:通过问题日期文件识别采集/鉴定日期的异常数据
- 志愿者贡献研究:分析Bionomia平台志愿者对标本数据标注的贡献模式
- 生物分类学研究:辅助理解标本鉴定者的分类学工作轨迹