数据集概述
本数据集收录丹麦自然历史博物馆两栖爬行动物标本与采集者、鉴定者的关联数据,由Bionomia平台志愿者标注生成,原始标本数据源于全球生物多样性信息机构(GBIF)聚合的数据集。数据以Frictionless Data数据包格式组织,包含9个文件,涵盖标本关联信息、用户信息、文献引用等内容。
文件详解
- 数据文件包配置文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的配置文件,定义数据集元数据、文件清单及数据结构规范
- 标本关联信息文件
- 文件名称:occurrences.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本与采集者/鉴定者的关联记录、归属信息及排除关联的声明数据
- 人员与文献文件
- 文件名称:users.csv.zip、citations.csv.zip、articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录参与标注的用户信息、相关文献引用及学术文章数据
- 问题数据文件
- 文件名称:problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含采集者、鉴定者日期信息存在问题的标本记录
数据来源
Bionomia平台(基于GBIF聚合的丹麦自然历史博物馆两栖爬行动物标本数据集,由志愿者标注生成)
适用场景
- 生物标本数据标准化:用于优化两栖爬行动物标本采集者、鉴定者信息的关联与规范管理
- 生物多样性研究:为两栖爬行动物分类学、分布区系研究提供标本采集背景信息支持
- 科学数据溯源:分析标本数据的标注过程与人员贡献,支撑科研数据可追溯性研究
- 自然历史标本馆数字化:助力博物馆标本数据的数字化关联与开放共享应用开发