数据集概述
本数据集为“Global soil organisms”项目的生物标本数据,包含与采集者、鉴定者的关联信息。数据由Bionomia平台志愿者标注,基于Global Biodiversity Information Facility(GBIF)聚合的标本数据,采用Frictionless Data包格式组织,共11个文件。
文件详解
- 归档文件(共10个,格式均为ZIP)
citations.csv.zip:可能包含标本相关文献引用数据
missing_attributions.csv.zip:可能包含未关联采集者/鉴定者的标本记录
articles.csv.zip:可能包含相关学术文章信息
attributions.csv.zip:可能包含标本与采集者/鉴定者的关联归属数据
problem_collector_dates.csv.zip:可能包含采集日期存在问题的标本记录
users.csv.zip:可能包含参与标注的Bionomia用户信息
users_unresolved.csv.zip:可能包含未解决的用户相关数据
not_them_assertions.csv.zip:可能包含标注为“非该采集者/鉴定者”的断言数据
occurrences.csv.zip:可能包含标本的分布记录数据
- 配置文件
datapackage.json:格式为JSON,是Frictionless Data包的元数据配置文件,描述数据集的结构与属性
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:9f0e1ca6-fb08-4c72-9a4a-1e3b7a528c10)、Bionomia平台志愿者标注
适用场景
- 生物标本数据管理:用于完善全球土壤生物标本的采集者、鉴定者关联信息,提升标本数据完整性
- 生物多样性研究:支持分析土壤生物标本的采集历史、鉴定背景与分布特征
- 公民科学贡献评估:研究Bionomia志愿者在生物标本数据标注中的参与情况与贡献
- 标本数据质量控制:通过问题数据文件识别标本记录中的采集日期等异常信息,优化数据质量