数据集概述
本数据集覆盖印度806个燃煤机组,通过机器学习构建运行热耗率(SHR)数据,结合水压力风险、煤炭价格等环境因素提升预测精度。数据源于现有数据库扩展,是印度燃煤机组SHR最全面的记录,支持能源转型政策制定。
文件详解
- 热耗率数据文件(CSV格式):
- CEEW_supercritical_with_ws_price.csv:超临界机组SHR数据,含机组ID、电厂名称、状态、容量、热耗率、水压力风险、煤炭价格等字段
- CEEW_subcritical_with_ws_price.csv:亚临界机组SHR数据,字段同超临界文件
- gem_with_ws_price.csv:GEM数据库整合数据,含机组位置、所有者、容量、热耗率、环境特征等字段
- gem_predicted_supercritical.csv:超临界机组机器学习预测SHR结果
- gem_predicted_subcritical.csv:亚临界机组机器学习预测SHR结果
- 环境与价格数据文件(CSV格式):
- State_wise_coal_price.csv:印度各邦煤炭价格数据
- State_water_stress.csv:印度各邦水压力风险数据
- GIS空间数据文件:
- india-polygon.shp:印度地理边界多边形文件(SHP格式)
- indiawater.geojson:印度水资源地理数据(GeoJSON格式)
- 文档文件:
- A Dataset of the Operating Station Heat Rate for 806 Indian Coal Plant Units using Machine Learning.pdf:数据集说明文档
适用场景
- 能源政策制定:为印度燃煤电厂能效提升与减排政策提供数据支撑
- 电力系统规划:分析不同技术类型(超临界/亚临界)机组的运行效率差异
- 环境风险评估:研究水压力风险对燃煤电厂运营的影响
- 经济成本分析:探索煤炭价格波动与电厂热耗率的关联
- 地理空间分析:结合GIS数据可视化区域能效分布与环境风险
- 机器学习应用:作为能源预测模型的训练数据优化精度