数据集概述
本数据集为英国爱丁堡皇家植物园活体植物收藏的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含九份文件,覆盖关联属性、文献引用、用户信息等内容。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,定义数据集的结构、文件清单及相关描述信息
- 关联属性文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含采集者与鉴定者的关联属性信息
- 文献引用文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:关联的文献引用数据
- 标本记录文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:植物标本的 occurrence 记录数据
- 用户信息文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与标注的志愿者用户信息
- 采集日期问题文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集日期存在问题的记录数据
- 鉴定日期问题文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鉴定日期存在问题的记录数据
- 排除断言文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标注为“非该采集者/鉴定者”的断言数据
- 文章关联文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:与标本关联的文章数据
数据来源
Bionomia平台志愿者标注,基于全球生物多样性信息机构(GBIF)数据集(编号:7adf20e0-c955-11de-95c0-b8a03c50a862)
适用场景
- 生物多样性元数据完善:补充植物标本采集者与鉴定者的关联信息,提升标本数据的完整性
- 植物分类学研究:分析采集者与鉴定者的工作分布,支持分类学历史研究
- 数据质量评估:利用日期问题文件识别并修正标本记录中的时间错误
- 志愿者贡献分析:通过用户信息文件研究公民科学参与者的标注行为与贡献模式
- 文献关联分析:整合文章数据,探索植物标本研究的文献引用网络