数据集概述
本数据集为论文《Review of the genus Pseudolathra Casey, 1905 (Coleoptera: Staphylinidae: Paederinae) of Réunion Island》关联的自然历史标本数据,包含标本与采集者、鉴定者的关联信息,由Bionomia志愿者标注,基于GBIF聚合的标本数据集整理,以Frictionless Data数据包格式呈现,共9个文件。
文件详解
- 核心数据文件(ZIP格式,共8个)
- citations.csv.zip:引用数据文件,格式为CSV压缩包
- not_them_assertions.csv.zip:非关联声明数据文件,格式为CSV压缩包
- problem_collector_dates.csv.zip:采集者日期问题数据文件,格式为CSV压缩包
- occurrences.csv.zip:标本 occurrence 数据文件,格式为CSV压缩包
- attributions.csv.zip:归属信息数据文件,格式为CSV压缩包
- articles.csv.zip:文献关联数据文件,格式为CSV压缩包
- problem_determiner_dates.csv.zip:鉴定者日期问题数据文件,格式为CSV压缩包
- users.csv.zip:用户关联数据文件,格式为CSV压缩包
- 数据包描述文件
- datapackage.json:Frictionless Data数据包描述文件,格式为JSON,包含数据集元数据信息
数据来源
Global Biodiversity Information Facility(GBIF)数据集(https://gbif.org/dataset/f33668f0-a019-4bcb-ab8b-06d6b8323963),由Bionomia志愿者标注生成
适用场景
- 昆虫分类学研究:支持留尼汪岛伪扁甲属的分类修订与物种鉴定工作
- 生物多样性标本管理:分析标本采集者、鉴定者的关联信息,完善标本元数据
- 分类学文献关联研究:通过citations.csv.zip和articles.csv.zip关联相关分类学文献,支撑文献计量分析
- 标本数据质量评估:利用problem_collector_dates.csv.zip和problem_determiner_dates.csv.zip识别标本日期数据问题,优化数据质量