数据集概述
本数据集包含与《西马德雷山脉梯度中的植物多样性:索诺拉州圣哈维尔和耶科拉地区的植物区系和植被》相关的自然历史标本数据,关联了标本的采集者和鉴定者信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,共包含9个文件。
文件详解
- 数据文件包(Frictionless Data package)
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的描述文件,定义数据集的元数据和结构。
- 引用数据文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本相关的引用信息。
- 标本发生数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含植物标本的发生记录数据。
- 归属信息文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本采集者和鉴定者的归属信息。
- 用户数据文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含参与数据标注的用户信息。
- 排除断言文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含排除某些人员关联的断言信息。
- 文献数据文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含相关的文献引用数据。
- 采集者日期问题文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含采集者日期存在问题的记录。
- 鉴定者日期问题文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含鉴定者日期存在问题的记录。
数据来源
Bionomia平台(数据集ID:7f7a401a-f762-11e1-a439-00145eb45e9a),基于Global Biodiversity Information Facility聚合的标本数据
适用场景
- 生物多样性研究:分析西马德雷山脉植物标本的采集者和鉴定者网络,支持植物区系多样性研究。
- 标本数据质量控制:使用日期问题文件识别和修正标本采集与鉴定日期的错误记录。
- 科学贡献者归因研究:通过归属信息和用户数据,研究志愿者在生物标本数据标注中的贡献。
- 植物学文献关联分析:结合文献数据文件,探索标本数据与相关研究文献的关联。
- 生物标本数据标准化:基于Frictionless Data数据包结构,推动植物标本数据的标准化共享与整合。