数据集概述
本数据集包含ISM爬行动物学标本馆中与采集者和鉴定者相关联的自然历史标本数据,由志愿者通过Bionomia平台基于GBIF聚合的标本数据标注而来,采用Frictionless Data数据包格式,共含9个文件。
文件详解
- 压缩文件(.zip格式)
- 文件名称:citations.csv.zip、users.csv.zip、articles.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:包含标本采集与鉴定相关的引用、用户、文章、归属声明、非本人断言、标本记录、采集者日期问题、鉴定者日期问题等结构化数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准的数据包元数据文件,包含数据集的基本信息、文件清单及数据结构描述
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合的ISM Herpetology Collection标本数据
适用场景
- 生物标本溯源研究: 通过关联的采集者与鉴定者信息,追溯ISM爬行动物学标本的采集背景与分类鉴定过程
- 生物多样性数据整合: 为全球生物多样性信息系统补充标本关联的人员元数据,提升数据完整性
- 自然历史标本管理优化: 分析problem_collector_dates、problem_determiner_dates等文件中的日期问题,完善标本馆数据质量
- 生物分类学研究支持: 利用occurrences、attributions等数据,辅助爬行动物分类单元的分布与分类历史研究