数据集概述
本数据集包含CEPEC标本馆(Centro de Pesquisas do Cacau - Herbário Virtual REFLORA)的自然历史标本与采集者、鉴定者的关联数据,由Bionomia平台志愿者标注生成,原始标本数据来自Global Biodiversity Information Facility聚合数据集,采用Frictionless Data数据包格式组织,共包含9个文件。
文件详解
- 数据集文件清单(共9个,含8个ZIP压缩文件和1个JSON元数据文件):
- citations.csv.zip:ZIP格式,包含引文相关数据
- occurrences.csv.zip:ZIP格式,包含标本 occurrence 数据
- problem_collector_dates.csv.zip:ZIP格式,包含采集者日期问题数据
- attributions.csv.zip:ZIP格式,包含归属关系数据
- not_them_assertions.csv.zip:ZIP格式,包含"非本人"断言数据
- articles.csv.zip:ZIP格式,包含文献文章数据
- datapackage.json:JSON格式,Frictionless Data数据包的元数据文件
- problem_determiner_dates.csv.zip:ZIP格式,包含鉴定者日期问题数据
- users.csv.zip:ZIP格式,包含用户相关数据
数据来源
Global Biodiversity Information Facility(数据集ID:c71c8000-9fc7-422c-804a-ce6abe751771);Bionomia平台志愿者标注
适用场景
- 生物标本数据规范化:用于清理和规范CEPEC标本馆采集者、鉴定者的关联信息
- 生物多样性研究:分析标本采集者与鉴定者的协作网络及标本分布特征
- 自然历史标本元数据优化:通过问题数据文件改进标本日期等元数据质量
- 生物标本馆数据管理:支持标本馆数字化管理系统中采集者、鉴定者信息的关联整合