数据集概述
本数据集为Chocó理工大学(CTUCh)Teriológica馆藏的自然历史标本数据,包含标本与采集者、鉴定者的关联信息。数据由志愿者通过Bionomia平台标注,基于Global Biodiversity Information Facility聚合的标本数据构建,以Frictionless Data数据包格式组织,共含11个文件。
文件详解
- 数据文件(共11个,含10个ZIP压缩文件、1个JSON文件)
- 压缩文件(ZIP格式):包含citations.csv.zip、articles.csv.zip、users_unresolved.csv.zip、occurrences.csv.zip、problem_determiner_dates.csv.zip、attributions.csv.zip、missing_attributions.csv.zip、not_them_assertions.csv.zip等,推测内部为CSV格式数据,涵盖标本采集者/鉴定者关联、文献引用、标本记录、未解析用户、日期问题记录、归属信息等内容
- 数据包描述文件:datapackage.json(JSON格式),为Frictionless Data数据包的元数据文件,定义数据集结构与属性
数据来源
Global Biodiversity Information Facility(数据集ID:953c792e-1417-4d0a-97b6-b0a1d7c96f0d)、Bionomia平台志愿者标注
适用场景
- 生物标本数据管理: 用于CTUCh Teriológica馆藏标本的采集者、鉴定者信息关联与整理
- 生物多样性研究: 分析标本背后的采集者网络、鉴定者专业领域分布
- 自然历史标本数字化: 支持标本数据的标准化关联与开放共享
- 志愿者标注数据质量评估: 基于problem_determiner_dates等文件分析标注数据的问题与改进方向