数据集概述
本数据集为图宾根植物标本馆维管植物标本的采集者与鉴定者关联数据,由Bionomia志愿者标注生成,原始标本数据来自全球生物多样性信息网络(GBIF)聚合的数据集,包含标本记录、采集者/鉴定者信息及相关引用,采用Frictionless Data数据包格式组织。
文件详解
- 核心数据文件(共9个,含8个ZIP压缩文件和1个JSON文件)
citations.csv.zip:CSV格式压缩文件,包含数据集相关引用信息
attributions.csv.zip:CSV格式压缩文件,记录采集者与鉴定者的归属信息
articles.csv.zip:CSV格式压缩文件,关联标本的文献资料信息
occurrences.csv.zip:CSV格式压缩文件,维管植物标本的采集记录信息
datapackage.json:JSON格式文件,Frictionless Data数据包的描述文件,定义数据集结构与元数据
not_them_assertions.csv.zip:CSV格式压缩文件,标注非目标采集者/鉴定者的信息
problem_collector_dates.csv.zip:CSV格式压缩文件,记录采集者信息中存在日期问题的条目
problem_determiner_dates.csv.zip:CSV格式压缩文件,记录鉴定者信息中存在日期问题的条目
users.csv.zip:CSV格式压缩文件,参与数据标注的志愿者用户信息
数据来源
Bionomia平台志愿者标注数据,原始标本数据来自Global Biodiversity Information Facility(GBIF)数据集(编号:ab1de8e9-8a18-4ffe-b2c6-e13ffbec3e7e)
适用场景
- 植物标本馆数据管理:优化图宾根植物标本馆维管植物标本的采集者与鉴定者信息关联
- 生物多样性研究:分析维管植物标本的采集历史与鉴定背景,支持植物分类学研究
- 科学数据标注质量评估:通过问题日期文件识别并修正采集者/鉴定者信息中的时间错误
- 志愿者参与模式研究:基于用户文件分析生物多样性数据众包标注的志愿者行为特征
- 文献与标本关联分析:利用引用和文献文件构建植物标本与学术文献的关联网络