数据集概述
本数据集为加拿大自然博物馆两栖爬行动物标本的采集者与鉴定人关联数据,由Bionomia志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式呈现,包含9个文件,覆盖标本关联信息、文献引用、用户数据及问题记录等内容。
文件详解
- 核心数据文件
- 文件名称:
occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含两栖爬行动物标本的基本记录信息,如标本编号、物种分类、采集地点等基础数据
- 文件名称:
attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含标本与采集者、鉴定人的关联归属信息
- 辅助说明文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的描述文件,包含数据集元信息、文件清单及数据结构定义
- 文件名称:
citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含与标本相关的文献引用信息
- 文件名称:
articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含相关研究文献的记录信息
- 文件名称:
users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含参与标注的志愿者用户信息
- 问题记录文件
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含标注中排除错误关联的记录信息
- 文件名称:
problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含采集者信息中存在日期问题的记录
- 文件名称:
problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含鉴定人信息中存在日期问题的记录
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:74f92761-3a24-4d85-9bfb-00b1fee0119d),由Bionomia志愿者标注生成
适用场景
- 生物标本采集历史研究: 分析加拿大自然博物馆两栖爬行动物标本的采集者、鉴定人及其关联关系
- 生物多样性数据整合: 为全球生物多样性信息机构(GBIF)的标本数据提供采集者、鉴定人维度的补充关联信息
- 标本数据质量控制: 利用问题记录文件识别标本采集、鉴定信息中的日期错误等质量问题
- 公民科学参与分析: 通过用户数据研究志愿者在生物标本数据标注中的参与情况及贡献价值