数据集概述
本数据集为“CNIN/Tipos Diptera”的生物标本数据,由志愿者在Bionomia平台标注采集者与鉴定者关联信息,基于GBIF聚合的标本数据构建,以Frictionless Data数据包格式组织,包含9个文件,支持生物标本元数据的关联分析。
文件详解
- 数据文件包描述
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的描述文件,定义数据集的元数据信息
- 关联属性文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本数据中采集者与鉴定者的关联属性信息
- 文献引用文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本相关的文献引用数据
- 文章关联文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:与标本关联的文章数据
- 采集者日期问题文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者日期存在问题的标本记录
- 排除断言文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标注为“非该采集者/鉴定者”的断言数据
- 标本发生数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:双翅目标本的发生记录数据
- 鉴定者日期问题文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鉴定者日期存在问题的标本记录
- 用户信息文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与标注的用户信息数据
数据来源
Bionomia平台志愿者标注(基于Global Biodiversity Information Facility聚合的数据集,数据集编号:8508f6fc-f762-11e1-a439-00145eb45e9a)
适用场景
- 生物标本元数据关联分析: 研究双翅目标本采集者与鉴定者的关联关系
- 生物多样性数据质量评估: 分析标本日期信息的问题数据,优化数据质量
- 志愿者贡献研究: 基于用户信息文件分析生物多样性数据标注的志愿者参与情况
- 文献与标本关联研究: 通过文献引用与文章关联文件,探索标本数据与学术文献的关联
- 生物分类学研究支持: 为双翅目昆虫分类学研究提供标本采集与鉴定的背景信息支持