数据集概述
本数据集是哥伦比亚蠕虫标本馆(Colección Colombiana de Helmintos)的自然历史标本数据,包含与采集者和鉴定者的关联信息。数据由Bionomia平台志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据,采用Frictionless Data数据包格式组织,共包含十一个文件。
文件详解
- 压缩数据文件(ZIP格式,共10个)
- 文件名称:citations.csv.zip、articles.csv.zip、users.csv.zip、occurrences.csv.zip、not_them_assertions.csv.zip、attributions.csv.zip、missing_attributions.csv.zip、users_unresolved.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(包含CSV文件)
- 字段映射介绍:分别对应标本引用、相关文献、用户信息、标本记录、排除声明、关联归属、缺失归属、未解析用户、采集日期问题等结构化数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,包含数据集基本信息、文件清单及格式定义
数据来源
Bionomia平台(数据集ID:820ef301-cd17-4f72-aff6-11b42fd68879)、全球生物多样性信息机构(GBIF,数据集ID:820ef301-cd17-4f72-aff6-11b42fd68879)
适用场景
- 生物标本馆数据关联分析: 研究哥伦比亚蠕虫标本馆标本与采集者、鉴定者的关联关系
- 生物多样性数据标准化: 基于Frictionless Data格式优化标本数据的存储与共享
- 标本采集历史研究: 通过采集者信息和日期数据,分析区域蠕虫标本采集活动的时间分布
- 志愿者标注数据质量评估: 评估Bionomia平台志愿者对标本关联信息标注的准确性与完整性