数据集概述
本数据集为亚马逊大学昆虫实验室(LEUA)长翅目标本的采集者与鉴定者关联数据,由志愿者通过Bionomia平台基于GBIF聚合的标本数据生成,包含采样、鉴定、引用等多维度信息,以Frictionless Data数据包格式组织,共11个文件。
文件详解
- 核心数据包文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包描述文件,定义数据集元数据及数据文件结构
- 压缩数据文件(共10个,格式均为ZIP)
citations.csv.zip:标本引用信息
attributions.csv.zip:标本归属与贡献者关联信息
occurrences.csv.zip:长翅目标本采集事件与标本记录信息
missing_attributions.csv.zip:未关联归属信息的标本记录
not_them_assertions.csv.zip:已标记为错误关联的贡献者记录
problem_collector_dates.csv.zip:采集日期存在异常的标本记录
problem_determiner_dates.csv.zip:鉴定日期存在异常的标本记录
users.csv.zip:参与数据处理的志愿者用户信息
数据来源
Bionomia平台(数据集ID:683f7c2b-8e39-47bd-a97b-7a160f061977)、Global Biodiversity Information Facility(GBIF,数据集ID:683f7c2b-8e39-47bd-a97b-7a160f061977)
适用场景
- 生物标本库数据标准化:用于优化LEUA长翅目标本数据的采集者、鉴定者关联逻辑与格式规范
- 生物多样性研究元数据补充:为长翅目分类学、生物地理学研究提供标本采集与鉴定的人员关联信息
- 公民科学贡献分析:分析Bionomia平台志愿者参与标本数据整理的行为模式与贡献价值
- 标本数据质量控制:通过异常日期文件识别并修正标本采集、鉴定环节的时间记录错误
- 生物标本引用网络构建:基于引用文件构建长翅目标本的学术引用关系网络