数据集概述
本数据集包含与《比利时昆虫学期刊》相关的自然历史标本数据,关联了标本的采集者和鉴定者信息。数据由志愿者在Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集生成,以Frictionless Data数据包格式组织,共包含九个文件。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,包含数据集的结构、资源信息等。
- 引用数据文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本相关的引用信息。
- 采集者日期问题数据文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录采集者日期存在问题的标本数据。
- 排除断言数据文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标注为“非该采集者/鉴定者”的断言数据。
- 归属数据文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录标本采集者和鉴定者的归属信息。
- 期刊文章数据文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含《比利时昆虫学期刊》相关文章的信息。
- 用户数据文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录参与标注的志愿者用户信息。
- 标本发生数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本的发生记录信息。
- 鉴定者日期问题数据文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录鉴定者日期存在问题的标本数据。
数据来源
Bionomia平台志愿者标注,基于全球生物多样性信息设施(GBIF)数据集(https://gbif.org/dataset/5fc76459-f4aa-40ee-811f-35639caad705)
适用场景
- 生物多样性标本元数据分析: 研究昆虫标本的采集者、鉴定者关联关系及数据质量。
- 昆虫学文献与标本关联研究: 分析《比利时昆虫学期刊》中提及的标本信息与实际标本记录的对应关系。
- 公民科学贡献评估: 评估Bionomia平台志愿者对标本元数据标注的贡献及数据质量。
- 生物多样性数据标准化研究: 基于Frictionless Data数据包格式,探索生物多样性元数据的标准化组织方式。