数据集概述
本数据集为蜉蝣目扁蜉科Cincticostella insolta复合体研究的关联数据,包含印度北部及尼泊尔3个新种描述相关的生物标本采集者、鉴定者信息。数据由Bionomia志愿者标注,基于GBIF聚合的标本数据,以Frictionless Data包格式组织,含9个文件。
文件详解
- 数据集描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的元数据文件,定义数据集结构、文件清单及格式规范
- 归档数据文件(共8个ZIP文件)
- 文件名称:
citations.csv.zip、articles.csv.zip、occurrences.csv.zip、not_them_assertions.csv.zip、problem_collector_dates.csv.zip、users.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:包含标本采集引用、文献、分布记录、鉴定异议、采集日期问题、用户信息、归属关系、鉴定日期问题等结构化数据
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:709324d2-fa93-49df-8dec-4cfe5bbff810)及Bionomia志愿者标注
适用场景
- 蜉蝣分类学研究:支持Cincticostella insolta复合体及新种的采集者、鉴定者信息追溯与验证
- 生物标本数据标准化:分析采集日期、鉴定日期等字段的问题数据,优化标本元数据质量
- 生物多样性数据关联:整合采集者、鉴定者与标本记录的关联关系,支撑生物多样性大数据分析
- 科学贡献归因研究:通过归属关系数据,明确标本研究中各参与者的贡献角色