数据集概述
本数据集为Magdalena大学生物收藏中线虫标本的采集者与鉴定者关联数据,包含由志愿者通过Bionomia平台标注的标本归属信息,原始标本数据来自全球生物多样性信息机构(GBIF)聚合的数据集,整体以Frictionless Data数据包格式组织,共含11个文件。
文件详解
- 压缩文件(ZIP格式,共10个)
- 文件名称:citations.csv.zip、problem_collector_dates.csv.zip、articles.csv.zip、attributions.csv.zip、occurrences.csv.zip、users_unresolved.csv.zip、missing_attributions.csv.zip、not_them_assertions.csv.zip、users.csv.zip
- 文件格式:ZIP(内含CSV文件)
- 字段映射介绍:分别对应引用信息、采集日期问题数据、文献文章、归属标注、标本记录、未解析用户、缺失归属、非本人声明、用户信息等关联数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,包含数据集的结构、模式等信息
数据来源
Bionomia平台(志愿者标注)、全球生物多样性信息机构(GBIF,数据集ID:5cf4c9f1-7075-46eb-bc8e-7f059e4f61b0)
适用场景
- 生物标本数据管理: 用于整理Magdalena大学线虫标本的采集者与鉴定者关联关系,完善标本元数据
- 生物多样性研究: 分析线虫标本的采集分布、鉴定人员信息,支持生物多样性分布规律研究
- 标本归属验证: 通过归属标注与缺失归属数据,验证标本的采集者、鉴定者信息准确性
- 志愿者标注数据质量评估: 基于未解析用户、日期问题等数据,评估Bionomia平台志愿者标注数据的质量