数据集概述
本数据集为圣保罗大学生物科学研究所Xiloteca标本馆(SPFw)的自然历史标本数据,包含标本与采集者、鉴定者的关联信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息 facility(GBIF)聚合的标本数据整理,以Frictionless Data数据包格式呈现,共9个文件。
文件详解
- 文件名称及格式:
citations.csv.zip:ZIP格式,可能包含标本相关文献引用数据
occurrences.csv.zip:ZIP格式,可能包含标本采集记录数据
articles.csv.zip:ZIP格式,可能包含相关学术文章信息
attributions.csv.zip:ZIP格式,可能包含采集者、鉴定者的标注归属信息
users.csv.zip:ZIP格式,可能包含参与标注的志愿者用户信息
not_them_assertions.csv.zip:ZIP格式,可能包含非关联主体的标注声明数据
datapackage.json:JSON格式,Frictionless Data数据包的描述文件
problem_collector_dates.csv.zip:ZIP格式,可能包含采集者日期存在问题的记录
problem_determiner_dates.csv.zip:ZIP格式,可能包含鉴定者日期存在问题的记录
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:03929cfc-82e3-4f21-97e3-7be4de285584)、Bionomia平台志愿者标注
适用场景
- 生物标本元数据管理:用于整理SPFw标本馆标本与采集者、鉴定者的关联关系
- 生物多样性研究:支撑标本采集历史、鉴定过程的追溯与分析
- 分类学研究辅助:为物种鉴定者的专业背景、工作历史研究提供数据支持
- 标本馆数字化建设:作为标本数据标准化、关联化处理的参考案例
- 志愿者标注数据质量评估:通过问题日期文件分析标注数据的质量问题