数据集概述
本数据集为美洲锥蝽标本数据的采集者与鉴定者关联数据,基于CEPAVE实验室美洲锥蝽标本数据,由Bionomia志愿者标注生成,包含标本采集者、鉴定者的关联信息及相关问题记录,以Frictionless Data包格式组织,共9个文件。
文件详解
- 数据文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的描述文件,定义数据集元数据及各数据文件的结构信息
- 压缩数据文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本相关的引用信息
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含美洲锥蝽标本的发生记录信息
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含鉴定者日期相关的问题记录
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含相关文献文章信息
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含采集者与鉴定者的关联归属信息
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标注志愿者用户信息
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含非目标关联的声明记录
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含采集者日期相关的问题记录
数据来源
Global Biodiversity Information Facility(数据集ID:eae731a7-3e82-4295-b0b3-ec72d75a402d)、Bionomia(标注平台)
适用场景
- 生物标本数据管理:用于完善美洲锥蝽标本采集者与鉴定者的关联信息,提升标本数据完整性
- 生物多样性研究:支持美洲锥蝽标本数据的溯源分析,辅助物种分布及采集历史研究
- 数据质量控制:通过问题记录文件分析标本采集与鉴定信息的质量问题,优化数据清洗流程
- 志愿者贡献研究:基于用户信息文件研究Bionomia平台志愿者对生物标本数据标注的贡献模式