数据集概述
本数据集为OAC-BIO标本馆的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含9个文件。
文件详解
- 数据文件包配置文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的配置文件,定义数据集的元数据信息。
- 引用数据文件
- 文件名称:
citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本相关的引用信息。
- 鉴定者日期问题数据文件
- 文件名称:
problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录鉴定者日期存在问题的标本信息。
- 非匹配断言数据文件
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含非匹配人员的断言信息。
- 采集者日期问题数据文件
- 文件名称:
problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录采集者日期存在问题的标本信息。
- 标本 occurrence数据文件
- 文件名称:
occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本的 occurrence 信息。
- 用户数据文件
- 文件名称:
users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标注志愿者等用户信息。
- 文章数据文件
- 文件名称:
articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含相关的文章信息。
- 归属数据文件
- 文件名称:
attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本采集者与鉴定者的归属信息。
数据来源
Bionomia平台(https://bionomia.net/dataset/68829f71-56b1-4015-a363-ef8f0e1d6e4f)、全球生物多样性信息机构(GBIF,https://gbif.org/dataset/68829f71-56b1-4015-a363-ef8f0e1d6e4f)
适用场景
- 生物标本馆人员关联研究:分析OAC-BIO标本馆标本采集者与鉴定者的关联关系。
- 生物多样性数据质量评估:基于日期问题数据文件,评估标本采集与鉴定日期的准确性。
- 志愿者标注行为研究:通过用户数据文件,研究Bionomia平台志愿者的标注行为特征。
- 标本归属信息分析:利用归属数据文件,分析标本采集者与鉴定者的归属情况。
- 生物多样性数据整合:将本数据集与其他标本数据整合,支持更全面的生物多样性研究。