合成时序数据异常检测基准数据集2020
数据来源: 互联网公开数据
标签: 时序数据,异常检测,合成数据,时间序列,基准测试,算法评估,机器学习
数据概述:
本数据集是一个合成的时间序列数据集,专门设计用于测试和评估异常检测算法的性能。该数据集包含超过10000个数据点,时间步长为1小时,起始时间为2020年1月1日00:00。数据集由以下几个系列组成:
value_0: 具有每日和每周周期性的时间序列。
value_1 到 value_5: 具有不同步长变化的随机数值序列,采用Kaggle Notebook (https://www.kaggle.com/code/caesarlupum/anomaly-detection-time-series-changefinder/notebook) 中描述的方法生成。
value_6 到 value_10: 将 value_0 与 value_1 到 value_5 组合而成的序列,计算公式为 value_x = 10*value_0 + abs(value_i)。
数据用途概述:
该数据集主要用于异常检测算法的开发、测试和性能比较。研究人员和开发者可以使用此数据集来:
评估不同异常检测算法在具有周期性和随机变化的时间序列上的表现。
比较不同算法的灵敏度、精确度和计算效率。
开发和优化新的异常检测方法。
建立异常检测算法的基准测试(benchmark)。
该数据集也适合用于教学,帮助学习者理解时间序列异常检测的基本概念和常见算法。