数据集概述
本数据集为CNR-ISA农业食品微生物数据集(ISA01-CC)的关联数据,包含通过Bionomia平台由志愿者标注的标本采集者、鉴定者信息及归属声明,原始标本数据由全球生物多样性信息设施(GBIF)聚合。数据集采用Frictionless Data数据包格式,共含11个文件,主要为压缩文件与配置文件,用于记录标本关联的人员信息、文献引用及数据问题记录。
文件详解
- 压缩文件(共10个,格式为.zip)
- 包含文件:citations.csv.zip、articles.csv.zip、occurrences.csv.zip、users.csv.zip、attributions.csv.zip、users_unresolved.csv.zip、missing_attributions.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip
- 内容说明:分别存储文献引用、标本记录、用户信息、归属声明、未解析用户、缺失归属及采集者/鉴定者日期问题等结构化数据
- 配置文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 内容说明:Frictionless Data数据包的配置文件,定义数据集元数据及文件结构
数据来源
Global Biodiversity Information Facility(GBIF,数据集编号aebc4372-55b7-4ddf-8bd1-5693eb67e8b3)、Bionomia平台(志愿者标注)
适用场景
- 农业食品微生物标本数据溯源: 分析标本采集者、鉴定者的归属关系与历史记录
- 生物多样性数据质量评估: 基于日期问题文件识别标本关联人员信息的错误或缺失
- 微生物资源管理研究: 整合标本记录与文献引用数据,支撑农业食品微生物资源的管理与利用
- 开放科学数据关联分析: 利用Frictionless Data格式实现跨平台数据集的标准化整合与共享