数据集概述
本数据集为红海新种鳚鱼(Entomacrodus solus)的采集者与鉴定者关联数据,基于全球生物多样性信息机构(GBIF)聚合的标本数据,由Bionomia平台志愿者标注生成。数据包含标本记录、采集者/鉴定者关联、文献引用等信息,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 核心数据文件
- 文件名称:occurrences.csv.zip、citations.csv.zip、articles.csv.zip
- 文件格式:ZIP压缩包(内含CSV)
- 字段映射介绍:包含标本记录、文献引用、相关文章等基础数据
- 关联与断言文件
- 文件名称:attributions.csv.zip、not_them_assertions.csv.zip
- 文件格式:ZIP压缩包(内含CSV)
- 字段映射介绍:记录采集者/鉴定者与标本的关联关系、非关联断言信息
- 问题数据文件
- 文件名称:problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:ZIP压缩包(内含CSV)
- 字段映射介绍:包含采集日期、鉴定日期存在问题的记录
- 元数据与用户文件
- 文件名称:datapackage.json、users.csv.zip
- 文件格式:JSON、ZIP压缩包(内含CSV)
- 字段映射介绍:datapackage.json为数据集元数据;users.csv.zip包含相关用户信息
数据来源
Bionomia平台(数据集ID:339e40fa-d510-4f27-afb4-c8f09746fcdf),原始标本数据来自Global Biodiversity Information Facility(GBIF,数据集ID:339e40fa-d510-4f27-afb4-c8f09746fcdf)
适用场景
- 生物分类学研究:分析红海新种鳚鱼的采集与鉴定过程,支持物种分类验证
- 生物多样性数据关联:构建标本记录与采集者、鉴定者的关联网络,完善生物多样性数据库
- 科学数据质量评估:通过问题日期文件分析标本数据中的时间信息误差,优化数据清洗流程
- 志愿者贡献研究:基于用户文件研究Bionomia平台志愿者参与生物数据标注的模式与贡献度