数据集概述
本数据集为根特大学动物学博物馆昆虫标本的采集者与鉴定者关联数据,由志愿者在Bionomia平台标注生成,基于全球生物多样性信息设施(GBIF)聚合的标本数据,包含9个文件,以Frictionless Data数据包格式组织,用于记录昆虫标本相关的人员关联、文献引用及数据问题等信息。
文件详解
- 数据文件(共9个,含8个ZIP压缩文件和1个JSON文件)
citations.csv.zip:ZIP格式,可能包含标本相关的文献引用数据
occurrences.csv.zip:ZIP格式,可能包含昆虫标本的采集记录数据
attributions.csv.zip:ZIP格式,可能包含数据标注的人员归属信息
problem_collector_dates.csv.zip:ZIP格式,可能包含采集者日期数据中的问题记录
articles.csv.zip:ZIP格式,可能包含相关研究文献信息
datapackage.json:JSON格式,Frictionless Data数据包的元数据文件,描述数据集结构
problem_determiner_dates.csv.zip:ZIP格式,可能包含鉴定者日期数据中的问题记录
users.csv.zip:ZIP格式,可能包含参与数据标注的用户信息
not_them_assertions.csv.zip:ZIP格式,可能包含标注中排除错误关联的记录
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF)
适用场景
- 生物标本数据管理:用于整理和关联昆虫标本的采集者、鉴定者信息,完善标本元数据
- 生物多样性研究:支持分析昆虫标本的采集历史、分布及相关研究文献
- 数据质量控制:通过问题日期记录优化标本数据的准确性
- 公民科学项目分析:研究志愿者参与生物标本数据标注的模式与贡献