# Electricity-Price-Forecasting **Repository Path**: duyu09/Electricity-Price-Forecasting ## Basic Information - **Project Name**: Electricity-Price-Forecasting - **Description**: 2025 "Future Cup" Big Data Challenge Problem B Open Source Code Weighting and Thesis. 2025年“未来杯”大数据挑战赛B题开源代码权重及论文。 2025 Cúp Vị Lai Thử thách Dữ liệu Lớn Bài toán B: Trọng số mã nguồn mở và luận văn. - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-01-18 - **Last Updated**: 2026-01-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 电力价格预测 ## 2025年“未来杯”大数据挑战赛B题代码、权重及论文开源 ### 文档语言 [**简体中文**](./README.zh-CN.md) | [**英语 (English)**](./README.md) | [**越南语 (Tiếng Việt)**](./README.vi.md) ### 概述 随着全球能源转型的加速,以风、光为代表的新能源在电力系统中的比重日益增加。这种变革虽然推动了清洁能源的发展,但新能源出力的随机性与波动性也导致电力现货市场价格呈现出高度的非线性与不确定性。精准的日前电价预测已成为发电商竞价、电网调度及市场监管的核心需求。本项目基于2025年 _未来杯_ (英语: _Future Cup_; 越南语: _Cúp Vị Lai_)高校大数据挑战赛提供的多源异构数据,构建了一套从数据治理、机制挖掘到高精度预测的端到端解决方案。 高质量的数据是模型成功的基石。面对涵盖气象、负荷、新能源出力及历史电价的多源异构数据,本项目首先建立了一套稳健的数据预处理流水线。针对原始数据中存在的缺失与噪声问题,我们采用了一种高效的自监督插值框架,结合Hankel矩阵正则化技术,在维护时序数据内在结构的同时完成了缺失值的智能填补。随后,我们通过分层对齐策略,将不同频率的采样数据统一至15分钟的时间颗粒度,为后续分析奠定了标准化的数据基础。 在深入建模之前,项目对市场运行机制进行了深度的统计归因分析。我们不仅统计了电价触达极值的时空分布规律,更通过曼-惠特尼U检验揭示了市场状态与电价偏差之间存在约8小时的显著滞后效应,为特征工程提供了关键的时间窗依据。为了捕捉复杂的市场模态,我们引入谱聚类算法对多维特征进行重构,识别出多种典型的市场运行情景(如“高风光出力”或“高温高负荷”),并将这些情景标签作为关键特征引入模型。结合SHAP可解释性分析,我们进一步量化了风光发电量对电价的抑制作用及温度的非线性影响,确保了模型的透明度。 本项目的核心突破在于构建了一种“基于Transformer与注意力机制的特征融合时序预测模型”。鉴于单一模型难以兼顾长程趋势与局部突变,我们创新性地设计了三支路并行架构:第一支路利用Transformer编解码器捕捉长程时序依赖;第二支路通过跨时特征注意力机制,检索历史中相似的气象场景以辅助推理;第三支路则采用逐步MLP直接映射特征与价格的非线性关系。这就好比让模型同时具备了“宏观趋势研判”、“历史经验类比”和“直觉反应”三种能力。最终,一个动态融合模块会根据当前样本特性,自适应地加权整合三路输出,从而显著提升了模型在应对电价尖峰与剧烈波动时的鲁棒性。 综上所述,本项目实现了一个闭环的电力市场预测系统,并在测试集中成功输出了高精度的96点日前电价预测序列,证明了深度融合模型在处理复杂时序回归问题上的优越性。目前,包括数据预处理脚本、训练好的模型权重及推理代码在内的所有工程文件均已开源,旨在为电力市场的大数据分析与AI应用提供可复现的参考方案。 ### I. 项目目录结构 **仅包含主要文件,非重要文件从略。** ```text Electricity-Price-Forecasting │ B250068.pdf <-- 参赛论文PDF文件 │ LICENSE │ README │ ├─mechine_learning │ │ data3.csv │ │ spectral_clusting_findK.py <-- 谱聚类 k 值寻优 │ │ test.py │ │ xgboost_best.py <-- 第三问,第四问的机器学习模型 │ │ xgboost_try.py │ │ │ └─output_k=6_best │ └─three_path_model │ data.csv <-- 已规整的数据 │ draw_stat_chart.py <-- 绘制统计图 │ imputation.py <-- 填补缺失值(填补模型训练+实施填补) │ interpolate.py <-- 插值法对齐时间粒度 │ mwu.py <-- 曼-惠特尼 U 检测(计算 p 值 e 值绘制热图) │ scaler.pt <-- 模型标准化参数 │ three_path_model_epoch80.pth <-- 192 时间步最优模型权重 │ tptsm.py <-- 日前电价时间序列预测模型训练与推理 │ └─images ``` ### II. 基于曼-惠特尼U检验的交易开停与实时/日前电价差关系研究热图($p$值) 该图揭示了影响电力交易开停机状态的关键因素:即以目标时刻为中心,前后100个时间步范围内,每个时间步的日前与实时电价之差对其的影响程度。 ### III. 基于XGBoost+谱聚类方法:电价受各外生变量影响的SHAP图 ### IV. 基于三路特征融合深度学习的方法:模型架构图 ### V. 深度学习模型训练损失下降曲线图 > **精度实验、消融实验、梯度归因等实验结果参见论文。** ### 著作权声明 **Copyright © 2025~2026** [**何非凡**](https://faculty.lzjtu.edu.cn/chenmei/zh_CN/xsxx/2554/content/1835.htm) (英语:HE Feifan;越南语:HÀ Phi Phàm)、[**杜宇**](https://faculty.lzjtu.edu.cn/chenmei/zh_CN/xsxx/2554/content/1837.htm) (英语:DU Yu;越南语:ĐỖ Vũ),[**兰州交通大学电子与信息工程学院**](https://dxxy.lzjtu.edu.cn/) (英语:School of Electronic and Information Engineering, Lanzhou Jiaotong University;越南语:Đại Học Giao thông Lan Châu, Học Viện Điện Tử Và Công Nghệ Thông Tin)