数据集概述
本数据集为CMNH鸟类标本馆(CMNH Birds Collection)的标本数据,关联了标本的采集者与鉴定者信息。数据由志愿者在Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据集生成,采用Frictionless Data数据包格式,包含9个文件。
文件详解
- 归档文件(共8个,格式均为ZIP)
citations.csv.zip:可能包含相关文献引用信息
articles.csv.zip:可能包含关联的学术文章信息
not_them_assertions.csv.zip:可能包含非目标人员的标注断言信息
problem_collector_dates.csv.zip:可能包含采集者日期存在问题的记录
users.csv.zip:可能包含标注志愿者的用户信息
attributions.csv.zip:可能包含采集者与鉴定者的归属标注信息
problem_determiner_dates.csv.zip:可能包含鉴定者日期存在问题的记录
occurrences.csv.zip:可能包含标本的采集事件与分布信息
- 数据描述文件
datapackage.json:格式为JSON,是Frictionless Data数据包的描述文件,定义数据集的元数据、文件清单及结构规范
数据来源
Bionomia平台(标注者为志愿者Scribes),基于全球生物多样性信息机构(GBIF)聚合的CMNH鸟类标本数据集(数据集ID:f93694b5-e994-4c07-a95f-90b14d5cf5e7)
适用场景
- 生物标本采集历史研究:分析CMNH鸟类标本的采集者网络与采集活动时间线
- 分类学鉴定溯源:追溯鸟类标本鉴定者的专业背景与鉴定工作分布
- 生物多样性数据治理:识别标本元数据中日期字段的质量问题,优化数据清洗流程
- 公民科学贡献分析:研究志愿者在生物标本数据标注中的参与模式与贡献价值
- 标本关联数据整合:为CMNH鸟类标本数据集补充采集者与鉴定者的结构化关联信息