数据集概述
本数据集为CardObs自然观察数据中采集者与鉴定者的关联数据,CardObs是由法国自然历史博物馆(MNHN)遗产自然服务部/UMS PatriNat(OFB - CNRS - MNHN)开发的自然观察录入管理工具,包含Pascal Dupont的自然数据。数据由志愿者在Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式呈现。
文件详解
- 压缩文件(共8个)
- 文件名称:citations.csv.zip、not_them_assertions.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip、articles.csv.zip、problem_collector_dates.csv.zip、attributions.csv.zip、occurrences.csv.zip
- 文件格式:ZIP(压缩包内为CSV格式)
- 字段映射介绍:包含与采集者、鉴定者关联的引用、断言、日期问题、用户、文章、归属、物种出现等相关结构化数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准的数据包元数据文件,描述数据集的整体结构、文件清单及格式规范
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF,数据集ID:eae096ac-c585-4234-99cb-b32e7c517604)
适用场景
- 生物多样性标本数据溯源: 分析自然历史标本的采集者、鉴定者信息,追溯标本数据的来源与归属
- 生物多样性数据质量评估: 通过问题日期文件(problem_collector_dates、problem_determiner_dates)识别采集、鉴定日期的异常记录,优化数据质量
- 公民科学参与研究: 基于users.csv.zip和attributions.csv.zip分析志愿者在生物多样性数据标注中的贡献模式
- 自然观察数据关联分析: 整合物种出现数据(occurrences.csv.zip)与采集者、鉴定者信息,研究生物多样性分布与人类观察活动的关联