数据集概述
本数据集为UiT Tromsø Museum的NORSC-Sciaroidea自然历史标本关联数据,包含与标本采集者、鉴定者相关的信息。数据由Bionomia志愿者标注,基于GBIF聚合的标本数据,以Frictionless Data数据包格式组织,共9个文件,主要为压缩文件和配置文件。
文件详解
- 核心数据文件(压缩包)
- 文件名称:citations.csv.zip、occurrences.csv.zip、users.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、articles.csv.zip、problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含标本相关的引用、记录、用户、归属、排除声明、文献、鉴定者日期问题、采集者日期问题等结构化数据
- 配置文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据配置文件,定义数据集结构、文件清单及数据规范
数据来源
Global Biodiversity Information Facility(GBIF)数据集(88fd0226-d867-4946-be8b-31f584f2201d),由Bionomia志愿者标注生成
适用场景
- 生物多样性标本管理: 用于自然历史标本采集者、鉴定者信息的关联与整合
- 分类学研究: 支持Sciaroidea类群标本的采集与鉴定历史追溯
- 生物数据标准化: 作为Frictionless Data格式的生物标本数据示例,用于数据规范研究
- 志愿者贡献分析: 分析Bionomia平台志愿者对标本数据标注的贡献模式
- 标本数据质量控制: 通过问题日期文件识别采集者、鉴定者信息中的时间记录问题