数据集概述
本数据集为论文《Big and beautiful: the Megaxyela species (Hymenoptera, Xyelidae) of East Asia and North America》关联的自然历史标本数据,包含标本与采集者、鉴定者的关联信息,由Bionomia志愿者标注,基于GBIF聚合的标本数据,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 数据集文件包
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包描述文件,定义数据集元数据及各数据文件的结构信息
- 引用数据文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含与标本相关的文献引用信息
- 非目标断言数据文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录非目标标本的断言信息
- 采集者日期问题数据文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含采集者日期存在问题的标本记录
- 标本发生数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录标本的发生记录信息
- 文献数据文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含相关研究文献的信息
- 鉴定者日期问题数据文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含鉴定者日期存在问题的标本记录
- 归属数据文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录标本数据的归属信息
- 用户数据文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含参与数据标注的用户信息
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:e6b25548-6721-4e1e-a68e-663c949b3306);Bionomia平台志愿者标注数据
适用场景
- 昆虫分类学研究: 分析Megaxyela物种的标本采集者、鉴定者信息及标本分布
- 生物多样性数据质量评估: 基于采集者/鉴定者日期问题数据,优化标本数据质量
- 科学贡献者网络分析: 通过归属数据和用户数据,研究昆虫分类学领域的研究者合作网络
- 文献与标本关联研究: 结合引用数据和文献数据,探索标本数据与研究文献的关联关系
- 生物多样性信息标准化: 参考Frictionless Data数据包格式,推动昆虫标本数据的标准化管理