数据集概述
本数据集关联了“国家蠕虫标本馆数据库更新与净化:P085和Q028”项目中的采集者和鉴定者自然历史标本数据,由志愿者在Bionomia平台标注,基于GBIF聚合的标本数据,以Frictionless数据包格式组织,包含9个文件。
文件详解
- 数据文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless数据包描述文件,定义数据集元数据
- 压缩文件
- 文件名称:
citations.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本相关引用数据
- 文件名称:
users.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标注志愿者用户信息
- 文件名称:
occurrences.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本 occurrence 数据
- 文件名称:
problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:采集者日期问题数据
- 文件名称:
attributions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标注归属信息
- 文件名称:
articles.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:相关文献数据
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:非本人标注声明数据
- 文件名称:
problem_determiner_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:鉴定者日期问题数据
数据来源
Bionomia平台(https://bionomia.net/dataset/7f64cabe-f762-11e1-a439-00145eb45e9a),基于Global Biodiversity Information Facility聚合数据(https://gbif.org/dataset/7f64cabe-f762-11e1-a439-00145eb45e9a)
适用场景
- 生物标本数据管理:支持国家蠕虫标本馆数据库的更新与净化工作
- 生物多样性研究:关联采集者和鉴定者信息,辅助生物分类学研究
- 公民科学分析:分析Bionomia平台志愿者标注行为及数据质量
- 标本数据标准化:识别并修正标本日期等元数据问题
- 生物数据引用研究:通过citations.csv.zip分析标本数据引用情况