Prodigy_Based_Eclipse超级计算机HPC系统生产环境异常检测数据集_Artifact

数据集概述

本数据集包含美国Sandia国家实验室Eclipse超级计算机上的应用运行数据,涵盖LAMMPS、sw4、sw4Lite、ExaMiniMD四类应用,每种应用分别在正常状态和注入“memleak”异常状态下各运行五次,共一百六十个样本,其中异常样本和健康样本各八十个,用于HPC系统无监督异常检测研究。

文件详解

  • 压缩包文件
  • 文件名称:eclipse_small_prod_dataset.tar
  • 文件格式:TAR
  • 字段映射介绍:包含Eclipse超级计算机上应用运行的原始数据,涵盖正常与异常状态下的应用运行记录
  • 数据文件
  • 文件名称:fe_eclipse_tsfresh_raw_CHI_2000.json
  • 文件格式:JSON
  • 字段映射介绍:基于tsfresh工具处理的原始特征数据,包含CHI_2000相关特征,用于HPC系统异常检测分析

数据来源

Sandia National Laboratories的Eclipse超级计算机

适用场景

  • HPC系统异常检测研究: 用于开发和验证生产环境下高性能计算系统的无监督异常检测算法
  • 系统性能分析: 分析Eclipse超级计算机上应用正常与异常状态下的运行特征差异
  • 异常类型研究: 针对“memleak”等常见HPC系统异常类型的特征提取与识别研究
  • 应用性能优化: 基于应用运行数据优化LAMMPS、sw4等科学计算应用在HPC系统中的运行效率
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 42.69 MiB
最后更新 2026年1月2日
创建于 2026年1月2日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。