数据集概述
本数据集为Porcupine海洋自然历史协会数据集内的海洋生物标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据生成,包含9个文件,以Frictionless Data数据包格式组织。
文件详解
- 压缩文件(ZIP格式,共8个)
- 文件名:
citations.csv.zip、users.csv.zip、problem_collector_dates.csv.zip、occurrences.csv.zip、problem_determiner_dates.csv.zip、attributions.csv.zip、articles.csv.zip、not_them_assertions.csv.zip
- 文件格式:ZIP(内含CSV文件)
- 字段映射介绍:分别包含引用信息、用户信息、采集者日期问题记录、标本 occurrence 数据、鉴定者日期问题记录、标注归属信息、相关文献文章信息、非关联断言信息等结构化数据
- 数据包描述文件
- 文件名:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data标准的数据包元数据文件,包含数据集的结构、文件清单、字段定义等描述信息
数据来源
Porcupine Marine Natural History Society Dataset(通过Global Biodiversity Information Facility聚合,Bionomia平台志愿者标注)
适用场景
- 生物多样性标本溯源研究:分析海洋生物标本的采集者、鉴定者信息及关联关系,追溯标本采集历史
- 标本数据质量评估:通过问题日期文件识别采集者、鉴定者信息中的时间维度数据问题
- 生物标本标注贡献分析:基于归属文件统计志愿者对标本数据的标注贡献情况
- 海洋自然历史文献关联研究:通过文献文章文件链接标本数据与相关研究文献
- 生物标本数据集标准化研究:参考Frictionless Data数据包格式,探索生物标本数据的标准化组织方式