数据集概述
本数据集为下加利福尼亚自治大学鱼类标本馆计算机化数据库更新项目中的采集者与鉴定者关联数据,包含由Bionomia志愿者标注的生物标本采集、鉴定信息及相关引用、问题记录等,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 核心数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:推测包含标本 occurrence(出现记录)的核心信息,关联采集者与鉴定者数据
- 文件名称:attributions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:推测包含Bionomia志愿者对采集者、鉴定者信息的标注归属记录
- 文件名称:users.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:推测包含参与标注的Bionomia用户信息
- 问题记录文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:推测包含采集者日期信息存在问题的记录
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:推测包含鉴定者日期信息存在问题的记录
- 文件名称:not_them_assertions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:推测包含标注为“非该采集者/鉴定者”的断言记录
- 元数据与引用文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,包含数据集描述、文件清单等信息
- 文件名称:citations.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:推测包含数据集相关的引用文献信息
- 文件名称:articles.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:推测包含相关学术文章信息
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF,数据集ID:e7e019c6-5582-47ee-ae97-32e4cd66d4c6)
适用场景
- 生物标本数据标准化:用于鱼类标本采集者、鉴定者信息的规范化关联与整理
- 生物多样性研究:支撑鱼类标本馆数据库的更新完善,为鱼类多样性研究提供基础数据
- 标本数据质量控制:通过问题日期记录分析标本元数据质量,优化数据清洗流程
- 公民科学贡献研究:分析Bionomia志愿者标注行为,探究公民科学在生物标本数据整理中的作用
- 标本馆数据管理:为高校鱼类标本馆的计算机化数据库建设提供关联数据参考