数据集概述
本数据集为“MCP - Coleção de Abelhas”(MCP蜜蜂标本馆)的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集,以Frictionless Data数据包格式组织,包含9个文件,用于记录标本关联的人员信息及相关元数据。
文件详解
- 数据包元数据文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,包含数据集的描述、文件清单、格式规范等核心元数据信息。
- 压缩数据文件(共8个)
- 文件名称:citations.csv.zip、problem_collector_dates.csv.zip、not_them_assertions.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip、articles.csv.zip、occurrences.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:包含标本采集者/鉴定者关联的引用信息、日期问题记录、身份排除声明、人员归属信息、鉴定者日期问题记录、用户信息、相关文献信息及标本 occurrence 数据等内容,具体字段需解压CSV文件后查看。
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合数据集(数据集ID:90288ac6-ae3b-4c4e-8d15-a66744d2cc66)
适用场景
- 生物标本数字化管理: 用于MCP蜜蜂标本馆标本采集者、鉴定者信息的结构化整理与关联分析。
- 生物多样性研究: 辅助分析蜜蜂标本的采集历史、鉴定人员网络及标本数据的溯源。
- 标本数据质量控制: 通过problem_collector_dates、problem_determiner_dates等文件识别并修正标本日期信息的错误。
- 公民科学贡献研究: 分析Bionomia平台志愿者对标本数据关联工作的贡献模式与成果。