数据集概述
本数据集为Don H. Miller个人蜜蜂收藏的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia平台志愿者Scribes基于Global Biodiversity Information Facility(GBIF)聚合的标本数据生成,以Frictionless Data数据包格式呈现,包含十一个文件,可用于生物标本采集与鉴定信息的关联分析。
文件详解
- 数据文件
- 压缩文件:包含citations.csv.zip、articles.csv.zip、missing_attributions.csv.zip、occurrences.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip、attributions.csv.zip、users.csv.zip,共八个ZIP格式压缩文件,分别对应引用、文章、缺失归属、标本记录、鉴定日期问题、排除断言、归属信息、用户等数据内容
- 数据包描述文件:datapackage.json,JSON格式,为Frictionless Data数据包的描述文件
- 文件格式:以ZIP压缩格式为主(十个文件,占比约百分之九十点九一),包含一个JSON格式文件(占比约百分之九点零九)
数据来源
Global Biodiversity Information Facility(GBIF)聚合的标本数据集(数据集ID:c2156d29-e096-43bc-aad0-5f852c661c78)
适用场景
- 生物标本采集与鉴定信息关联分析: 用于研究Don H. Miller个人蜜蜂收藏中标本采集者与鉴定者的关联关系
- 生物多样性标本数据整合: 作为GBIF聚合数据的补充,完善自然历史标本的元数据信息
- 标本归属问题研究: 分析缺失归属、鉴定日期问题等数据,探索标本归属信息的完善路径
- 志愿者贡献数据应用: 基于Bionomia志愿者标注数据,研究公民科学在生物标本数据整理中的作用