数据集概述
本数据集为盲鼹鼠(Spalacidae科)标本的采集者与分类学家关联数据,用于系统发育分析。数据由Bionomia志愿者标注生成,基于全球生物多样性信息机构(GBIF)的标本数据集,包含标本与人员的关联声明、未解析用户信息、日期问题记录等内容,以Frictionless数据包格式组织,共11个文件。
文件详解
- 核心数据文件(.zip格式)
- citations.csv.zip:引用相关数据压缩文件
- users_unresolved.csv.zip:未解析用户信息压缩文件
- problem_determiner_dates.csv.zip:分类学家日期问题记录压缩文件
- attributions.csv.zip:关联声明数据压缩文件
- not_them_assertions.csv.zip:非本人声明数据压缩文件
- problem_collector_dates.csv.zip:采集者日期问题记录压缩文件
- occurrences.csv.zip:标本出现记录压缩文件
- missing_attributions.csv.zip:缺失关联声明数据压缩文件
- users.csv.zip:用户信息压缩文件
- 数据包描述文件
- datapackage.json:Frictionless数据包的元数据描述文件,JSON格式
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:368d59c2-8b6e-45a5-9209-ead5a8461614);Bionomia平台志愿者标注
适用场景
- 系统发育研究:为盲鼹鼠科物种的系统发育分析提供标本采集者与分类学家的关联信息支撑
- 生物标本数据治理:分析标本数据中采集者、分类学家信息的完整性与准确性问题
- 生物多样性数据挖掘:整合标本关联数据,辅助研究盲鼹鼠科物种的分布与分类历史
- 科学数据标注研究:探讨志愿者标注模式在生物标本数据关联中的应用效果