数据集概述
本数据集包含法国国家自然历史博物馆(MNHN-Paris)化石收藏(F)中与采集者和鉴定者关联的自然历史标本数据,由志愿者通过Bionomia平台基于GBIF聚合的标本数据标注生成,采用Frictionless Data数据包格式,共9个文件。
文件详解
- 数据文件(.zip格式)
- 文件名称:citations.csv.zip、occurrences.csv.zip、articles.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip、not_them_assertions.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV文件)
- 字段映射介绍:分别包含引用信息、标本 occurrence 数据、相关文献、采集/鉴定者归属标注、鉴定者日期问题记录、用户信息、非目标人员断言、采集者日期问题记录等结构化数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准,包含数据集元数据(如名称、描述、文件清单、模式定义等)
数据来源
Bionomia平台(数据集ID:b275a4c1-9859-4f3c-8ead-d86dde820fbc),基于Global Biodiversity Information Facility(GBIF)聚合的标本数据
适用场景
- 古生物学标本溯源研究:通过采集者与鉴定者关联数据,追溯MNHN-Paris化石标本的采集背景与分类鉴定历史
- 生物多样性数据质量评估:分析problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip中的日期问题,优化标本元数据质量
- 科学史研究:利用采集者/鉴定者归属数据,研究化石收藏背后的科研人员网络与学科发展脉络
- 标本数据标准化应用:基于Frictionless Data数据包格式,探索自然历史标本关联数据的标准化共享与整合方法