数据集概述
本数据集包含克利夫兰自然历史博物馆馆藏自然历史标本与采集者、鉴定者的关联数据,由Bionomia平台志愿者标注生成,原始标本数据来源于全球生物多样性信息网络(GBIF)聚合的数据集,采用Frictionless Data数据包格式组织,共包含9个文件。
文件详解
- 核心数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含自然历史标本的基本记录信息,是关联采集者、鉴定者数据的基础
- 关联属性文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含标本记录与采集者、鉴定者的关联标注信息
- 问题记录文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含采集者日期信息存在问题的标本记录
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含鉴定者日期信息存在问题的标本记录
- 排除断言文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含已标注为非目标采集者/鉴定者的标本记录
- 引用文献文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含标本记录相关的文献引用信息
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含标本相关的文献文章信息
- 用户信息文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含参与标注的志愿者用户信息
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,包含数据集的结构、格式等信息
数据来源
Bionomia平台志愿者标注,原始标本数据来源于Global Biodiversity Information Facility(GBIF)聚合的数据集
适用场景
- 生物标本采集历史研究: 分析自然历史标本的采集者、鉴定者信息,还原标本采集历史脉络
- 生物多样性数据整合: 关联标本记录与人员信息,完善生物多样性数据库的元数据
- 标本数据质量评估: 利用问题记录文件分析标本日期等信息的质量问题,优化数据清洗流程
- 志愿者参与模式研究: 基于用户信息文件,研究公众科学项目中志愿者的参与行为与贡献
- 生物分类学文献计量分析: 通过引用文献文件,分析标本相关文献的分布与影响力