数据集概述
本数据集为危地马拉山谷大学生物收藏馆爬行动物标本的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,原始标本数据来源于全球生物多样性信息设施(GBIF)聚合的数据集,以Frictionless Data数据包格式组织,包含9个文件,支持爬行动物标本相关人员信息的关联分析。
文件详解
- 数据文件(共9个,含8个ZIP压缩文件和1个JSON文件)
citations.csv.zip:ZIP格式,推测包含标本相关引用数据
attributions.csv.zip:ZIP格式,推测包含采集者与鉴定者的归属关联数据
users.csv.zip:ZIP格式,推测包含参与标注的志愿者用户信息
problem_determiner_dates.csv.zip:ZIP格式,推测包含鉴定者日期存在问题的标本记录
problem_collector_dates.csv.zip:ZIP格式,推测包含采集者日期存在问题的标本记录
not_them_assertions.csv.zip:ZIP格式,推测包含非目标人员关联的声明数据
occurrences.csv.zip:ZIP格式,推测包含爬行动物标本的分布记录数据
articles.csv.zip:ZIP格式,推测包含标本相关文献数据
datapackage.json:JSON格式,Frictionless Data数据包的描述文件,包含数据集元信息
数据来源
Bionomia平台(由志愿者标注),原始标本数据来源于Global Biodiversity Information Facility(GBIF)聚合的危地马拉山谷大学生物收藏馆爬行动物标本数据集
适用场景
- 生物标本数据管理:用于爬行动物标本采集者、鉴定者信息的关联整合与标准化处理
- 生物多样性研究:支持分析爬行动物标本相关人员的贡献分布及标本记录的时间问题排查
- 标本数据质量控制:通过问题日期文件识别并修正标本采集、鉴定日期的错误记录
- 志愿者贡献分析:基于用户文件研究生物标本数据标注志愿者的参与情况与贡献价值