数据集概述
本数据集包含美国Sandia国家实验室Eclipse超级计算机上的应用运行数据,涵盖LAMMPS、sw4、sw4Lite、ExaMiniMD四类应用,每种应用分别在正常状态和注入“memleak”异常状态下各运行五次,共一百六十个样本,其中异常样本和健康样本各八十个,用于HPC系统无监督异常检测研究。
文件详解
- 压缩包文件
- 文件名称:eclipse_small_prod_dataset.tar
- 文件格式:TAR
- 字段映射介绍:包含Eclipse超级计算机上应用运行的原始数据,涵盖正常与异常状态下的应用运行记录
- 数据文件
- 文件名称:fe_eclipse_tsfresh_raw_CHI_2000.json
- 文件格式:JSON
- 字段映射介绍:基于tsfresh工具处理的原始特征数据,包含CHI_2000相关特征,用于HPC系统异常检测分析
数据来源
Sandia National Laboratories的Eclipse超级计算机
适用场景
- HPC系统异常检测研究: 用于开发和验证生产环境下高性能计算系统的无监督异常检测算法
- 系统性能分析: 分析Eclipse超级计算机上应用正常与异常状态下的运行特征差异
- 异常类型研究: 针对“memleak”等常见HPC系统异常类型的特征提取与识别研究
- 应用性能优化: 基于应用运行数据优化LAMMPS、sw4等科学计算应用在HPC系统中的运行效率