数据集概述
本数据集为Wikiplantbase #Toscana的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia志愿者标注,基于Global Biodiversity Information Facility聚合的标本数据集生成,格式为Frictionless Data包,包含9个文件,用于生物多样性相关的标本数据关联分析。
文件详解
- 核心数据文件(压缩包)
- 文件名称:citations.csv.zip、not_them_assertions.csv.zip、attributions.csv.zip、users.csv.zip、problem_determiner_dates.csv.zip、articles.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:分别包含标本引用、排除断言、归属信息、用户数据、鉴定者日期问题记录、相关文献、标本记录、采集者日期问题记录等关联数据
- 数据描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的描述文件,定义数据集的元数据信息
数据来源
Global Biodiversity Information Facility(GBIF)聚合的数据集(编号:5445131a-b491-44d8-9974-3ec52bde0c47);Bionomia平台志愿者标注数据
适用场景
- 生物标本数据关联分析: 研究自然历史标本与采集者、鉴定者的关联关系,完善标本元数据
- 生物多样性研究: 利用关联数据开展区域生物多样性分布及采集历史的分析
- 标本数据质量评估: 通过问题日期记录文件,识别并修正标本采集、鉴定日期的错误信息
- 志愿者贡献研究: 分析Bionomia平台志愿者对生物标本数据标注的贡献模式与质量