数据集概述
本数据集为比利时瓢虫(Coccinellidae)标本数据与采集者、鉴定者的关联信息,由Bionomia平台志愿者标注生成,原始标本数据来自GBIF聚合数据集。数据以Frictionless Data包格式组织,包含9个文件,主要记录标本的采集者、鉴定者归属、引用信息及数据问题记录等内容。
文件详解
- 核心数据文件
- 文件名称:attributions.csv.zip、occurrences.csv.zip、users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本与采集者/鉴定者的关联归属信息、瓢虫标本发生记录、标注志愿者用户信息等核心关联数据
- 辅助说明文件
- 文件名称:citations.csv.zip、articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录数据集相关的引用文献和学术文章信息
- 问题记录文件
- 文件名称:not_them_assertions.csv.zip、problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录采集者/鉴定者归属存疑的标注、鉴定日期问题、采集日期问题等数据质量问题记录
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准的数据集元数据描述文件,包含数据集结构、文件清单、字段定义等信息
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:42319b8f-9b9d-448d-969f-656792a69176),由Bionomia平台志愿者标注生成
适用场景
- 生物标本数据管理:用于完善比利时瓢虫标本的采集者、鉴定者元数据信息,提升标本数据完整性
- 生物多样性研究:支持瓢虫物种分布与采集者/鉴定者关联分析,探究区域物种调查历史
- 数据质量评估:通过问题记录文件分析生物标本数据中的归属错误、日期错误等质量问题
- 公民科学研究:研究志愿者标注模式对生物标本元数据补充的贡献与影响机制