数据集概述
本数据集为波兰科学院动物学博物馆鸟类标本的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据。数据以Frictionless Data数据包格式组织,包含9个文件,涉及标本采集、鉴定的关联信息、问题数据及用户信息等,可支持生物标本元数据的追溯与分析。
文件详解
- 压缩文件集(共8个,格式:ZIP)
- citations.csv.zip:标本相关引用数据
- attributions.csv.zip:采集者与鉴定者的归属关联数据
- problem_determiner_dates.csv.zip:鉴定者日期存在问题的标本数据
- articles.csv.zip:相关文献数据
- not_them_assertions.csv.zip:非目标人员的断言数据
- occurrences.csv.zip:标本 occurrence 数据
- users.csv.zip:标注用户信息数据
- problem_collector_dates.csv.zip:采集者日期存在问题的标本数据
- 数据包描述文件
- datapackage.json(格式:JSON):Frictionless Data数据包的元数据描述文件,定义数据集结构与属性
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(标本数据来源)
适用场景
- 生物标本元数据追溯:通过采集者与鉴定者关联数据,追溯鸟类标本的采集与鉴定背景
- 生物多样性研究:结合标本 occurrence 数据,分析鸟类标本的分布与采集历史
- 标本数据质量控制:利用问题日期数据,优化标本元数据的准确性
- 公民科学贡献分析:通过用户数据,研究志愿者在生物标本标注中的参与情况