数据集概述
本数据集为墨西哥国家流行病学和疾病控制研究所(InDRE)昆虫实验室医学重要节肢动物标本馆(CAIM)的标本数据,包含与采集者、鉴定者关联的自然历史标本信息,由志愿者通过Bionomia平台标注,基于GBIF聚合的标本数据集整理,以Frictionless数据包格式呈现,共9个文件。
文件详解
- 压缩文件(共8个)
- 文件名称:citations.csv.zip、not_them_assertions.csv.zip、users.csv.zip、occurrences.csv.zip、articles.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV文件)
- 字段映射介绍:分别对应引用信息、非关联声明、用户信息、标本记录、文献文章、归属信息、鉴定者日期问题记录、采集者日期问题记录等关联数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless数据包的元数据描述文件,包含数据集结构、文件清单等信息
数据来源
Bionomia平台(数据集ID:13b81e69-7c05-42ad-89e7-04bfdb21e707)、Global Biodiversity Information Facility(GBIF,数据集ID:13b81e69-7c05-42ad-89e7-04bfdb21e707)
适用场景
- 医学节肢动物标本管理:用于CAIM标本馆采集者、鉴定者与标本记录的关联整合与管理
- 生物多样性数据挖掘:分析医学重要节肢动物标本的采集历史、鉴定信息及相关文献关联
- 标本数据质量控制:通过日期问题文件识别并修正采集者、鉴定者信息中的时间错误
- 科学贡献归属研究:基于归属信息文件追溯医学节肢动物标本研究的参与者贡献
- 公共卫生 Entomology 研究:支撑医学相关节肢动物的分布、采集背景等公共卫生相关分析