数据集概述
本数据集包含无脊椎动物标本数据及其关联的采集者与鉴定者信息,由Bionomia平台志愿者标注生成,原始标本数据来源于全球生物多样性信息设施(GBIF)聚合的数据集。数据以Frictionless Data数据包格式组织,包含9个文件,用于记录标本的关联属性、问题日期及用户信息等。
文件详解
- 数据文件
- 文件名称:citations.csv.zip、articles.csv.zip、users.csv.zip、occurrences.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:ZIP(压缩包内为CSV)
- 字段映射介绍:分别记录标本的引用信息、文献文章信息、用户数据、标本发生记录、采集者/鉴定者关联属性、非本人声明、采集者日期问题记录、鉴定者日期问题记录
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准,包含数据集的元数据信息,如文件列表、格式说明等
数据来源
Bionomia平台(志愿者标注),原始标本数据来源于Global Biodiversity Information Facility(GBIF)数据集(编号82b0f51c-f762-11e1-a439-00145eb45e9a)
适用场景
- 生物标本数据溯源:通过采集者与鉴定者关联信息,追溯无脊椎动物标本的采集与鉴定过程
- 生物多样性研究:整合标本发生记录与文献引用数据,支持物种分布、分类学研究
- 数据质量评估:利用问题日期文件分析标本记录中的时间属性错误,优化数据质量
- 志愿者贡献分析:通过用户数据与关联属性文件,研究公民科学志愿者在标本数据标注中的贡献模式