多源分布式系统数据用于AI驱动分析数据集

数据集概述

本数据集提供了来自复杂分布式系统(OpenStack)的多源监测数据,包含分布式追踪、应用日志和指标三类核心数据,分为顺序用户请求(sequential_data)和并发用户请求(concurrent_data)两种场景,为AI驱动的运维任务研究提供多源整合的数据支持。

文件详解

该数据集包含两个压缩文件,具体说明如下: - 文件名称: sequential_data.zip:压缩文件格式,包含顺序用户请求场景下的分布式追踪、应用日志和指标数据,需解压后使用。 - 文件名称: concurrent_data.zip:压缩文件格式,包含并发用户请求场景下的分布式追踪、应用日志和指标数据,需解压后使用。

数据来源

GitHub仓库:https://github.com/SashoNedelkoski/multi-source-observability-dataset/

适用场景

  • AIOps算法研究:用于开发和验证融合多源监测数据的异常检测、根因分析等运维算法。
  • 分布式系统分析:探究顺序与并发请求场景下系统行为差异及性能瓶颈。
  • 多模态数据融合研究:支持分布式追踪、日志、指标三类数据的时间同步与关联分析方法开发。
  • 运维任务优化:为实际分布式系统的故障诊断、性能调优等运维实践提供数据基础。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 620.36 MiB
最后更新 2025年12月13日
创建于 2025年12月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。