数据集概述
本数据集为Sumner 2020年发布的《欧洲微蝇科与瘦足蝇科》Occurrence Dataset中,自然历史标本与采集者、鉴定者的关联数据。由Bionomia志愿者标注,基于GBIF聚合的标本数据,以Frictionless Data包格式组织,含9个文件,用于生物标本数据的采集者与鉴定者信息关联分析。
文件详解
- 数据集核心文件(共9个,含8个ZIP压缩文件、1个JSON文件)
- 文件名:citations.csv.zip、occurrences.csv.zip、not_them_assertions.csv.zip、users.csv.zip、articles.csv.zip、problem_collector_dates.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:包含标本采集引用、分布记录、采集者/鉴定者排除断言、用户信息、相关文献、采集日期问题记录、属性关联、鉴定日期问题记录等关联数据
- 文件名:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的描述文件,包含数据集元数据信息
数据来源
Bionomia平台(数据集ID:23cdb7f0-a1e4-4821-9986-10e92c5378e4),基于Global Biodiversity Information Facility(GBIF)聚合的Sumner 2020年欧洲微蝇科与瘦足蝇科标本数据
适用场景
- 生物标本采集者/鉴定者信息关联分析:通过标本数据与人员信息的关联,研究昆虫标本采集与鉴定的人员网络
- 生物多样性数据质量评估:利用日期问题记录文件,分析标本采集/鉴定日期的准确性问题
- 昆虫分类学研究支持:为欧洲微蝇科与瘦足蝇科的分类学研究提供标本分布及相关人员信息
- 生物标本元数据标准化研究:基于Frictionless Data包格式,探索生物多样性数据的标准化组织方式