数据集概述
本数据集为卡内基自然历史博物馆恐龙标本目录的关联数据,将标本数据与采集者、鉴定者信息链接。数据基于《Annotated catalogue of the dinosaurs》,由志愿者通过Bionomia平台标注,原始标本数据来自全球生物多样性信息机构(GBIF),采用Frictionless Data数据包格式组织。
文件详解
- 数据文件包核心文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包描述文件,定义数据集元数据、文件清单及数据结构规范
- 关联数据文件
- 文件名称:citations.csv.zip、not_them_assertions.csv.zip、users.csv.zip、problem_collector_dates.csv.zip、articles.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip、occurrences.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:包含标本采集者与鉴定者关联信息、引用数据、用户标注记录、日期问题数据、文献数据、归属关系数据及标本 occurrence 数据等
数据来源
Carnegie Museum of Natural History恐龙标本目录,由Bionomia志愿者标注,原始数据来自Global Biodiversity Information Facility(GBIF)
适用场景
- 古生物标本元数据分析:研究恐龙标本采集者、鉴定者的关联关系及历史记录
- 生物多样性数据标准化:基于Frictionless Data格式优化标本数据的组织与共享
- 自然历史博物馆藏品管理:辅助博物馆梳理恐龙标本的采集鉴定脉络
- 科学史研究:通过采集者、鉴定者数据追溯古生物研究的学术传承
- 标本数据质量控制:利用问题日期数据改进标本元数据的准确性