数据集概述
本数据集为HUCO标本馆(Herbário da Universidade Estadual do Centro-Oeste)的自然历史标本数据,包含标本与采集者、鉴定者的关联信息。数据由志愿者通过Bionomia平台标注,基于GBIF聚合的标本数据集,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 数据文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包描述文件,定义数据集的元数据信息
- 压缩文件
- 文件名称:citations.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本相关引用数据
- 文件名称:articles.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本相关文献文章数据
- 文件名称:attributions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:采集者与鉴定者的归属关联数据
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:采集者日期存在问题的标本数据
- 文件名称:not_them_assertions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:非指定采集者/鉴定者的声明数据
- 文件名称:occurrences.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本 occurrence 数据
- 文件名称:users.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:参与标注的用户数据
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:鉴定者日期存在问题的标本数据
数据来源
Global Biodiversity Information Facility(GBIF)数据集(https://gbif.org/dataset/1a86be2b-aa83-424a-9e55-9f6ee344fdfc),由Bionomia平台志愿者标注(https://bionomia.net/dataset/1a86be2b-aa83-424a-9e55-9f6ee344fdfc)
适用场景
- 生物标本数据管理: 用于HUCO标本馆标本与采集者、鉴定者的关联信息整理与维护
- 生物多样性研究: 分析标本采集者、鉴定者的贡献及标本分布特征
- 数据质量控制: 基于问题日期数据优化标本元数据质量
- 志愿者贡献分析: 研究Bionomia平台志愿者在标本数据标注中的参与情况