数据集概述
本数据集为FSUCML动物学馆藏的生物标本数据,包含与采集者、鉴定者的关联信息,由Bionomia志愿者标注生成,基于GBIF聚合的标本数据,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,包含数据集基本信息、文件清单及结构定义
- 文献引用文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本相关的文献引用数据
- 文章关联文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:与标本相关的学术文章关联数据
- 采集者日期问题文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者日期存在问题的记录数据
- 归属信息文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本采集者、鉴定者的归属标注数据
- 排除断言文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标注为非目标采集者/鉴定者的断言数据
- 标本记录文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:动物学标本的基本记录数据
- 用户信息文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与标注的志愿者用户信息
- 鉴定者日期问题文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鉴定者日期存在问题的记录数据
数据来源
Bionomia平台志愿者标注,基于Global Biodiversity Information Facility(GBIF)聚合的FSUCML动物学馆藏标本数据
适用场景
- 生物标本数据管理:完善FSUCML动物学馆藏标本的采集者、鉴定者关联信息,提升标本数据完整性
- 生物多样性研究:通过采集者、鉴定者的时空分布,分析动物标本的采集历史与生物多样性分布特征
- 科学史研究:梳理动物学标本采集者、鉴定者的学术活动轨迹,支撑科学史相关研究
- 数据质量评估:利用日期问题文件,评估标本采集、鉴定日期数据的质量,为数据清洗提供依据