数据集概述
本数据集包含腐生和木生甲虫标本与采集者、鉴定者的关联信息,由Bionomia平台志愿者标注生成,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,含9个文件,涵盖引用、日期问题、用户信息、归属、出现记录等内容。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,描述数据集整体信息
- 数据文件(压缩包格式)
- 文件名称:citations.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:包含标本相关引用信息
- 数据文件(压缩包格式)
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:鉴定者日期存在问题的记录
- 数据文件(压缩包格式)
- 文件名称:users.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:参与标注的用户信息
- 数据文件(压缩包格式)
- 文件名称:attributions.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:标本采集者、鉴定者的归属信息
- 数据文件(压缩包格式)
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:甲虫标本的出现记录信息
- 数据文件(压缩包格式)
- 文件名称:articles.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:相关文献文章信息
- 数据文件(压缩包格式)
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:采集者日期存在问题的记录
- 数据文件(压缩包格式)
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:标注为非目标人员的断言记录
数据来源
Bionomia平台(数据集ID:d3d38190-0c13-11df-b8c6-b8a03c50a862),原始标本数据来自Global Biodiversity Information Facility(数据集ID:d3d38190-0c13-11df-b8c6-b8a03c50a862)
适用场景
- 生物标本数据管理:整合甲虫标本与采集者、鉴定者的关联信息,完善标本元数据
- 生物多样性研究:支持腐生和木生甲虫分布、采集历史的分析
- 数据质量评估:通过日期问题文件识别标本记录中的时间信息错误
- 公民科学研究:分析志愿者标注的标本归属信息准确性与贡献模式
- 文献关联分析:利用引用和文章文件链接标本数据与相关研究文献