数据集概述
本数据集包含EAN - Herbário Jaime Coelho de Moraes标本馆自然历史标本与采集者、鉴定者的关联数据,由Bionomia志愿者标注生成,数据源自全球生物多样性信息机构(GBIF)聚合的标本数据集,采用Frictionless Data数据包格式组织,含9个文件。
文件详解
- citations.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含标本相关参考文献引用数据
- occurrences.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含标本采集记录相关数据
- problem_determiner_dates.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含鉴定者日期存在问题的标本记录数据
- users.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含参与标注的志愿者用户相关数据
- articles.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含与标本相关的学术文章数据
- problem_collector_dates.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含采集者日期存在问题的标本记录数据
- attributions.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含标本采集者与鉴定者的关联归属数据
- not_them_assertions.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含标注为“非该采集者/鉴定者”的标本记录数据
- datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包描述文件,推测包含数据集元数据、文件清单及格式定义等信息
数据来源
Bionomia平台(由志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合的标本数据集
适用场景
- 生物标本数据治理: 用于识别和修正标本采集者、鉴定者日期等元数据错误
- 生物多样性研究: 分析标本采集者与鉴定者的关联关系,支撑生物分类学、物种分布等研究
- 自然历史标本馆数据管理: 优化标本馆采集者与鉴定者关联数据的组织与管理
- 公民科学项目分析: 研究Bionomia志愿者标注的标本关联数据质量与应用价值