数据集概述
本数据集为“Monarca蝴蝶保护区鸟类区系”相关的自然历史标本数据,包含标本与收藏家、鉴定者的关联信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据集构建,采用Frictionless Data数据包格式,共包含九个文件。
文件详解
- 核心数据文件(.zip格式,共八个)
- 文件名:citations.csv.zip、users.csv.zip、not_them_assertions.csv.zip、problem_determiner_dates.csv.zip、attributions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、articles.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:包含标本引用信息、用户数据、非关联声明、鉴定者日期问题记录、归属信息、标本 occurrence 数据、收藏家日期问题记录及相关文献数据等。
- 数据包描述文件
- 文件名:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准,描述数据集的元数据信息,包括文件清单、数据结构定义等。
数据来源
全球生物多样性信息机构(GBIF)数据集(编号:2c77f896-e068-4837-8a55-d6b7d94c3b0d)及Bionomia平台志愿者标注
适用场景
- 生物标本数据管理:用于整理和关联Monarca蝴蝶保护区鸟类标本的收藏家、鉴定者信息。
- 生物多样性研究:支持分析保护区鸟类区系标本的采集历史与分类鉴定过程。
- 标本数据质量控制:通过日期问题记录文件,识别和修正收藏家、鉴定者信息中的时间错误。
- 生物分类学文献关联:利用articles.csv.zip文件,关联标本数据与相关研究文献。
- 志愿者贡献分析:基于users.csv.zip和attributions.csv.zip,研究Bionomia平台志愿者对标本数据标注的贡献模式。