# TGRF-ISSA-SVR

**Repository Path**: openharmony-sig-ib/tgrf-issa-svr

## Basic Information

- **Project Name**: TGRF-ISSA-SVR
- **Description**: TGRF-ISSA-SVR是一个用于光伏发电预测的混合模型，它通过随机森林筛选关键特征，结合改进的麻雀搜索算法优化支持向量回归进行点预测，并利用均值残差反馈和核密度估计对高随机性时段进行区间预测。该模型旨在提高预测精度并量化不确定性，适用于预测波动性较强的光伏发电数据。
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-05-12
- **Last Updated**: 2026-01-24

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# TGRF-ISSA-SVR

#### 介绍
TGRF-ISSA-SVR是一个用于光伏发电预测的混合模型，它通过随机森林筛选关键特征，结合改进的麻雀搜索算法优化支持向量回归进行点预测，并利用均值残差反馈和核密度估计对高随机性时段进行区间预测。该模型旨在提高预测精度并量化不确定性，适用于预测波动性较强的光伏发电数据。

#### 整体框架
![输入图片说明](image/2e173cf9d296df8921d55c9a0db0257.png)
- 步骤：
- 步骤1：数据处理
- 步骤2：使用SVR算法进行数据预测
- 步骤3：时间粒度均值残差反馈(TGRF)
- 使用TGRF提高模型预测性能，主要分为以下几步
- (1)当J=0时不进行反馈，当J=1,进行残差反馈，输入相关数据T。 
- (2)计算残差，计算TD的时间粒度均值残差，识别填充PD的时间粒度均值残差。
- (3)计算相关性筛选相关性强均值残差，进行反馈。
- (4)计算决定下次是否调用残差反馈的参数J,将反馈为TD的输入，反馈为PD的输入。
- 步骤4：ISSA对SVR超参数优化
- 使用ISSA优化SVR模型的超参数（c、g）。主要分为以下几步
- (1)当S=0，不调用参数优化模块，当S=1,调用参数优化模块，使用SLE对种群进行初始化。
- (2)使用平均绝对误差（MAE）为模型的适应度函数，计算初始适应度并排序。
- (3)更新发现者位置，更新跟随者位置，更新警戒者位置。
- (4)计算适应度并排序，判断目前是否满足ISSA的停止条件。满足停止条件则输出C、g，否则返回步骤4(3)，并继续执行。

### 1.SVR预测模型
支持向量回归（SVR, Support Vector Regression） 是一种基于 支持向量机（SVM） 的机器学习模型，专门用于解决 回归预测 问题。与传统的回归方法（如线性回归）不同，SVR 通过寻找一个最优超平面，使得预测值与真实值之间的偏差在允许的误差范围内最大化模型的泛化能力。在 TGRF-ISSA-SVR 中，SVR 被进一步优化（如 ISSA 优化超参数、TGRF 残差反馈修正），以提高光伏发电预测的精度和鲁棒性。
其目标函数如下：![输入图片说明](image/mubiaohanshu.png)
- 式中，f(x)为模型的输出变量；ω为特征空间权向量；x为输入变量；φ(x)为将x转换到高维特征空间中的非线性映射函数；s是正则化系数，是ε不敏感损失函数;b为偏置向量。

### 2.时间粒度残差反馈方法（TGRF）
由于预测模型只能得出历史数据（TD）的残差，待预测数据（PD）的残差是未知的，很少有使用残差反馈的方法来提高模型精度。该方法通过时间标签将TD与PD的残差值联系起来，计算不同时间粒度的均值残差，生成残差特征，将残差特征数据反馈作为输入特征。其核心思想是选择小时，周，月为时间粒度计算均值残差，通过判断残差是否与负荷值具有相关性来判断残差是否还有挖掘价值，若时间均值残差与负荷值具有相关性，则可以反馈作为输入特征，更新支持向量机的输入数据重新进行训练。
- 步骤
- 步骤1:输入TD和PD的时间特征(小时，日和月份)
- 步骤2:计算TD的时间粒度平均残差。
- 步骤3：PD残差特征填充
- 步骤4：计算相关系数；公式如下。
- ![输入图片说明](image/%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0.png)
- 式中，即为pearson相关系数；和分别为时间粒度均值残差和负荷实际值，时间粒度均值残差和负荷实际值的平均值；n为样本数量。保留与输出显著相关时间粒度均值残差，删除与输出不相关的时间粒度均值残差。
### 3.麻雀搜索算法改进（ISSA）
改进麻雀搜索算法（Improved Sparrow Search Algorithm, ISSA） 是对基础麻雀搜索算法（SSA）的优化版本，用于更高效地求解优化问题（如参数优化、函数寻优）。在 TGRF-ISSA-SVR 中，ISSA 用于优化支持向量回归（SVR）的关键超参数（如惩罚系数 C、核函数参数γ），以提升光伏发电预测的精度。
（1）. 基础麻雀搜索算法（SSA）简介
SSA 是一种受麻雀群体觅食和反捕食行为启发的元启发式算法，其核心思想是模拟麻雀的 探索者（发现食物）-跟随者（追逐食物）-警戒者（躲避危险） 三种角色分工：
- 探索者（Leader）：负责全局搜索，向最优解方向移动。
- 跟随者（Follower）：局部搜索，围绕探索者附近寻找更优解。
- 警戒者（Guard）：随机监视环境，避免陷入局部最优。
（2）. ISSA 的改进策略
- 改进拉丁超立方体对种群进行初始化：以最大化拉丁超立方体设计在多维空间中生成n个任意点。利用拉丁超立方抽样法形成了一种连续局部枚举的拉丁超立方体抽样策略。该方法有更好的空间填充性能和采样效率，能保证样本均匀覆盖在整个分布空间，且对于二维问题采样时间接近于零，寻优的参数为正则化系数C和核函数参数g。
- ![输入图片说明](image/ce4850ebbe2fc8dede0ba58c8ad84e4.png)
- 交流机制改进：SSA中除了适应度最优的发现者，其他发现者与跟随者没有任何沟通行为，浪费了适应度最好以外的发现者提供的信息。因此SSA错过高质量的解决方案的风险很大。因此设置一部分适应度值低的跟随者为随机跟随者，与发现者随机沟通交流，改进后保留了向最佳发现者集聚的跟随者，不影响算法收敛速度，增加了发现者与跟随者的沟通行为，降低了算法陷入局部最优的风险。原理图如下。
- ![输入图片说明](image/yuanlitu.png)