数据集概述
本数据集包含墨西哥莫雷洛斯大学(UAEM)CIByC昆虫标本数字化项目中,与采集者和鉴定者相关联的自然历史标本数据。数据由Bionomia平台志愿者标注生成,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,共包含9个文件。
文件详解
- 压缩文件(共8个)
- 文件名称:citations.csv.zip、not_them_assertions.csv.zip、users.csv.zip、articles.csv.zip、attributions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:ZIP(内含CSV文件)
- 字段映射介绍:分别对应引用信息、身份排除声明、用户信息、文献文章、归属信息、标本记录、采集者日期问题记录、鉴定者日期问题记录等关联数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data标准的数据包元数据文件,包含数据集结构、文件清单等描述信息
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF,数据集ID:3d05b094-6ab4-4d47-8ba8-0d6fc51655e0)
适用场景
- 生物标本元数据分析: 关联昆虫标本与采集者、鉴定者信息,支持标本采集历史追溯
- 生物多样性研究: 整合标本数据与人员信息,辅助分析昆虫物种分布及采集活动规律
- 标本馆数字化管理: 为莫雷洛斯大学昆虫标本馆的数字化项目提供关联数据支撑
- 生物数据质量控制: 利用日期问题记录文件,优化标本采集、鉴定信息的准确性校验
- 公民科学贡献研究: 分析Bionomia平台志愿者标注的归属数据,评估公民科学对生物数据的补充价值