多元时间序列预测数据集
数据来源:互联网公开数据
标签:时间序列预测,多元时间序列,数据标准化,多变量分析,预测模型评估,数据预处理,统一采样间隔
数据概述:
本数据集包含多个子集,涵盖了不同领域的时间序列数据,适用于多元时间序列预测任务。以下是各子集的简要描述:
- Electricity:记录了2011年至2014年间370个用户的用电量数据,每15分钟采集一次。统一采样间隔后,数据为每小时的平均用电量。
- ETT:记录了2016年至2018年间两个变电站的电力变压器负载和油温数据,每15分钟采集一次。统一采样间隔后,数据为每小时的负载和温度值。
- Exchange:收录了1990年至2016年间澳大利亚、英国、加拿大、瑞士、中国、日本、新西兰和新加坡的每日汇率数据。统一采样间隔后,数据保持每日一次的频率。
- QPS:记录了2022年5月至6月期间10个应用程序的每分钟查询量。统一采样间隔后,数据为每小时的查询量总和。
- Solar:记录了2006年 Alabama 州137个光伏发电站的每5分钟发电量数据。统一采样间隔后,数据为每小时的平均发电量。
- Traffic:记录了2015年至2016年间 San Francisco Bay Area 高速公路上862个传感器的每小时道路占有率数据。统一采样间隔后,数据保持每小时一次的频率。
- Weather:记录了2004年至2023年间德国 WS Beutenberg 气象站的每10分钟气象观测数据,包括温度、气压、湿度等20个变量。统一采样间隔后,数据为每小时的采样值。
统一处理后,上述数据集均以每小时为采样间隔,便于在同一基准下进行时间序列预测模型的性能评估。
数据用途概述:
该数据集适用于多元时间序列预测任务的研究与评估,支持多种应用场景,包括但不限于:
1. 时间序列预测:用于训练和评估多元时间序列预测模型,支持不同预测长度(如24小时、48小时、84小时和180小时)的任务需求。
2. 模型性能评估:数据集的标准化处理和统一采样间隔为模型性能的公平比较提供了基础。
3. 数据预处理研究:可用于探索不同数据预处理方法对时间序列预测任务的影响。
4. 领域分析:支持电力消耗、变压器负载、汇率波动、查询量、光伏发电、交通流量和气象预测等领域的研究与分析。
通过提供多样化的数据类型和统一的处理标准,该数据集为研究人员和从业者提供了丰富的实验和分析资源,有助于推动时间序列预测领域的技术发展。