数据集概述
本数据集是与论文“New taxa of crickets (Orthoptera: Grylloidea: Gryllinae, Phaloriinae and Pteroplistinae) from northern Borneo (Belait and Sandakan)”相关的自然历史标本数据,包含与采集者和鉴定者相关联的信息。数据由志愿者在Bionomia平台上标注,基于GBIF聚合的标本数据集,以Frictionless Data包格式组织,共包含9个文件。
文件详解
- 数据集文件包(Frictionless Data package)
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:作为Frictionless Data包的描述文件,通常包含数据集的元数据信息,如文件清单、数据结构定义等。
- 压缩CSV文件(共8个)
- 文件名称:
citations.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、articles.csv.zip、attributions.csv.zip、users.csv.zip、problem_collector_dates.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:包含与蟋蟀标本相关的多种数据,如标本采集记录(occurrences)、文献引用(citations)、采集者和鉴定者的归属信息(attributions)、用户信息(users)、以及存在问题的日期数据(problem_determiner_dates、problem_collector_dates)等。
数据来源
Bionomia平台(https://bionomia.net/dataset/1c4e2dfe-e755-4103-b920-08370f8f8183),基于Global Biodiversity Information Facility(GBIF)聚合的数据集(https://gbif.org/dataset/1c4e2dfe-e755-4103-b920-08370f8f8183)
适用场景
- 昆虫分类学研究: 用于分析婆罗洲北部蟋蟀新分类群的标本采集信息、分类鉴定记录及相关文献引用。
- 生物多样性数据整合: 结合GBIF和Bionomia平台数据,研究标本数据的归属关系与采集者、鉴定者的关联网络。
- 标本数据质量评估: 利用含问题日期的文件(problem_determiner_dates、problem_collector_dates),分析标本数据的时间信息准确性。
- 生物标本数字化管理: 参考Frictionless Data包格式,优化自然历史标本数据的组织与共享方式。