数据集概述
本数据集为“Database of invertebrates collected in Mongolia”的关联数据,包含蒙古无脊椎动物标本数据中采集者与鉴定者的关联信息。数据由Bionomia平台志愿者标注生成,基于全球生物多样性信息网络(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,共包含9个文件,用于记录标本的采集者、鉴定者归属及相关元数据。
文件详解
- 压缩文件(ZIP格式,共8个)
- 文件名称:citations.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip、users.csv.zip、problem_collector_dates.csv.zip、articles.csv.zip、occurrences.csv.zip
- 文件格式:ZIP
- 字段映射介绍:包含标本的采集者/鉴定者关联信息(attributions.csv)、采集/鉴定日期问题记录(problem_collector_dates.csv、problem_determiner_dates.csv)、用户标注信息(users.csv)、标本 occurrence 数据(occurrences.csv)、引用文献(citations.csv、articles.csv)及非归属声明(not_them_assertions.csv)等结构化数据
- 元数据文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,包含数据集描述、文件清单、字段定义等核心元信息
数据来源
Bionomia平台(https://bionomia.net/dataset/867dbe0a-f762-11e1-a439-00145eb45e9a),基于Global Biodiversity Information Facility(GBIF)聚合的标本数据(https://gbif.org/dataset/867dbe0a-f762-11e1-a439-00145eb45e9a)
适用场景
- 生物标本数据关联分析:用于链接蒙古无脊椎动物标本与采集者、鉴定者的归属关系,完善标本元数据
- 生物多样性数据质量评估:通过problem_collector_dates.csv、problem_determiner_dates.csv分析标本日期记录的问题,优化数据质量
- 生物分类学研究支持:利用occurrences.csv等文件的标本数据,辅助蒙古无脊椎动物的分类与分布研究
- 公民科学数据应用:分析Bionomia志愿者(Scribes)的标注贡献模式,探索公民科学在生物标本数据整理中的作用
- 生物多样性信息学工具开发:基于Frictionless Data数据包格式,开发标本数据关联与整合的工具或平台