数据集概述
本数据集包含哥伦比亚生物项目(Proyecto Colombia Bio)中特拉克伊河河口组织标本的采集者与鉴定者关联数据,由Bionomia志愿者标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据,采用Frictionless Data数据包格式,共9个文件,支持生物标本采集与鉴定信息的整合分析。
文件详解
- 压缩文件(ZIP格式,共8个)
- 文件名称:citations.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、articles.csv.zip、not_them_assertions.csv.zip、users.csv.zip、problem_determiner_dates.csv.zip、attributions.csv.zip
- 文件格式:ZIP
- 字段映射介绍:包含标本引用、出现记录、采集者/鉴定者日期问题、文献、身份排除声明、用户信息、归属信息等结构化数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,定义数据集结构、字段说明等核心信息
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:4ae715d1-e34b-4788-916e-f4360d078768)
适用场景
- 生物标本采集网络分析:通过采集者与鉴定者关联数据,研究标本采集活动的协作网络与区域分布
- 生物多样性标本溯源:结合引用与归属数据,追溯特拉克伊河河口标本的采集背景与鉴定过程
- 标本数据质量评估:利用日期问题文件,分析标本采集/鉴定日期记录的准确性与完整性
- 生物多样性项目管理:整合用户与归属数据,优化哥伦比亚生物项目的标本数据管理流程