数据集概述
该数据集包含2017年1月至2020年12月巴拉圭上巴拉那省的电力消耗与气象数据,涵盖55个馈线(14个变电站)的每小时电力消耗记录及单气象站每三小时的气象观测数据,可用于能源与气候相关的建模、模拟及机器学习算法验证。
文件详解
- 原始数据文件:
- meteorological-raw.csv:CSV格式,包含气象原始数据,字段包括datetime(时间)、temperature(温度)、humidity(相对湿度)、wind_speed(风速)、pressure(气压)
- electricity-consumption-raw.csv:CSV格式,包含电力消耗原始数据,字段包括datetime(时间)、substation(变电站)、feeder(馈线)、consumption(电流消耗)
- 处理后数据文件:
- meteorological-processed.csv:CSV格式,经过处理的气象数据,字段与原始气象文件一致,时间频率调整为每小时
- electricity-consumption-processed.csv:CSV格式,经过处理的电力消耗数据,字段与原始电力消耗文件一致
- 辅助文件:
- data-imputation.py:Python脚本,用于数据插补处理
- substations-geographical-location.csv:CSV格式,包含变电站地理位置信息
适用场景
- 能源消耗预测模型训练与验证
- 气象因素对电力需求影响的相关性分析
- 能源系统优化与模拟研究
- 机器学习回归/分类算法在能源领域的性能测试
- 气候与能源消耗耦合关系研究