# myPHM

**Repository Path**: openminds/myPHM

## Basic Information

- **Project Name**: myPHM
- **Description**: 航空发动机PHM神经网络设计
- **Primary Language**: Python
- **License**: MIT
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 1
- **Forks**: 1
- **Created**: 2025-10-09
- **Last Updated**: 2025-10-25

## Categories & Tags

**Categories**: Uncategorized

**Tags**: PHM

## README

# 航空发动机健康管理神经网络设计

## 混合架构技术原理

我们设计一个融合数据驱动与物理知识的神经网络模型，用于航空发动机健康管理（PHM）中的时间序列预测。我们将使用LSTM或GRU作为基础模型，并嵌入物理知识。

### 思路：

使用LSTM或GRU捕捉时间序列的动态特性。

将物理知识（例如发动机的物理模型、退化规律、约束条件）嵌入到网络中，这可以通过以下方式实现：
a. 在损失函数中加入物理约束（如物理方程残差、趋势约束等）。
b. 设计网络结构，使其输出满足物理规律（例如通过自定义层或激活函数）。
c. 将物理模型的输出与数据驱动模型的输出进行融合。

### 具体步骤：

步骤1：定义数据驱动的网络（LSTM或GRU）

输入：历史传感器数据（如温度、压力、转速等）和操作条件。

输出：预测的未来传感器数据或健康指标（如剩余使用寿命RUL）。

步骤2：物理知识嵌入

我们可以利用已知的发动机退化模型或物理方程（例如，性能衰减的指数模型、线性模型等）来约束网络输出。

例如，我们可以假设发动机的退化趋势是单调的，或者其变化率在一定范围内。

步骤3：设计损失函数

均方误差（MSE）或平均绝对误差（MAE）用于监督学习。

物理约束损失：例如，如果我们知道某个物理量应该满足的方程，我们可以计算网络输出与物理方程之间的残差，并将其加入损失函数。

步骤4：训练网络

同时优化数据驱动损失和物理损失。

### 示例模型结构：

我们假设有一个简单的物理模型，例如发动机的退化趋势可以用一个线性模型来近似，但我们不知道具体的参数。我们可以让网络学习这些参数，同时用物理约束来指导学习。

### 具体实现：

我们设计一个网络，它包含一个LSTM层和一个全连接层，输出是未来一段时间的目标变量（如RUL）。同时，我们假设物理模型是一个线性衰减模型，即 RUL(t) = RUL0 - k * t，其中k是衰减率。我们可以让网络输出k，然后计算物理模型预测的RUL，并将物理模型的预测与数据驱动模型的预测进行加权融合，或者将物理模型的残差作为损失的一部分。

但是，更一般的方法是引入物理约束损失。例如，我们要求网络预测的RUL变化趋势与物理模型一致（如单调递减）。我们可以通过添加一个正则项来惩罚非单调的预测。

另一种方法是使用物理模型来生成额外的输入特征，或者将物理模型的输出与网络输出结合。

这里我们提供一个简单的例子，我们使用LSTM网络，并在损失函数中加入物理约束（单调性约束）。

假设我们有一个时间序列的RUL标签，我们要求预测的RUL序列是单调非增的（因为发动机健康状态不会自动恢复）。我们可以在损失函数中加入一个惩罚项，当预测序列不满足单调非增时给予惩罚。

### 定义损失函数：

总损失 = MSE(预测RUL, 真实RUL) + λ * 物理损失

其中，物理损失可以定义为：对于每个时间步t，如果预测的RUL(t) < RUL(t-1)（即出现增长），则惩罚其增长量。

具体地，我们可以这样计算物理损失：

physical_loss = torch.mean(torch.relu(pred_RUL[1:] - pred_RUL[:-1]))

这里，我们使用ReLU函数，只有当后一个时间步的预测RUL大于前一个时间步时（即出现增长），才会取正值，否则为0。然后我们对这个正值求平均作为物理损失。

注意：这里我们假设RUL应该是单调非增的，所以如果出现增长就是违反物理规律。

### 代码结构：

#### 定义LSTM网络

在训练过程中，计算预测值

计算MSE损失和物理损失

总损失 = MSE损失 + λ * 物理损失

#### 反向传播

下面我们用PyTorch实现一个简单的例子。

注意：这个例子仅用于演示，实际应用中可能需要更复杂的网络结构和物理约束。

### 模型特点与优势

双驱动架构: 数据驱动GRU + 物理知识编码器

注意力融合: 自适应融合数据特征和物理特征

物理约束: 通过损失函数嵌入发动机物理特性

多任务学习: 同时预测寿命、故障和健康状态

可解释性: 物理特征提供模型决策的依据

这个框架可以有效地结合数据模式和学习到的物理知识，提高在航空发动机PHM任务中的预测准确性和鲁棒性。

### 混合网络结构总览

![LSTM架构结构图](./phm_lstm.svg "LSTM") <!-- 相对路径 -->

![GRU架构结构图](./phm_gru.svg "GRU") <!-- 相对路径 -->

 
### 关键设计特点

双路径架构: 数据驱动 + 物理知识并行处理

注意力融合: 自适应权重分配，动态调整数据与物理的贡献

多尺度特征: 时序特征 + 物理特征 + 统计特征

物理约束: 通过损失函数嵌入发动机运行规律

多任务学习: 共享特征，提高泛化能力

### 详细说明：

输入层：接收两个输入，一是传感器数据的时间序列（形状为[batch, seq_len, input_dim]），二是操作条件（形状为[batch, condition_features]）。

GRU层：处理时间序列，提取数据驱动特征。输出最后一个时间步的隐藏状态（形状为[batch, hidden_dim]）。

物理知识编码器：由多个全连接网络组成，分别模拟温度、振动、退化等物理关系。将操作条件编码为物理特征（形状为[batch, physics_dim]）。

注意力融合层：将数据驱动特征和物理特征进行投影后，通过多头注意力机制融合。首先将物理特征投影到与数据驱动特征相同的维度，然后以数据驱动特征作为Query，物理特征作为Key和Value，进行注意力计算。最后与数据驱动特征残差连接并层归一化。

多任务输出层：使用融合后的特征同时预测剩余寿命（使用Sigmoid激活，输出0到1之间的值）、故障检测（二分类，使用Softmax）和健康指标（回归，线性激活）。

损失函数由三部分组成：数据损失（均方误差和交叉熵）、物理约束损失（如寿命单调递减、健康指标与运行条件的关系）和趋势约束损失（寿命预测和健康指标趋势一致性）。

这个设计使得模型既学习数据中的模式，又遵循物理规律，提高了模型的准确性和可解释性。

## Transformer架构技术原理

将原有的混合架构（GRU/LSTM + 物理知识编码器）改为Transformer架构。主要改动包括：

使用Transformer编码器替代GRU/LSTM进行序列建模。

保留物理知识编码器和注意力融合机制，但需要调整以适配Transformer的输出。

调整输入数据的处理方式，因为Transformer需要位置编码。

### 步骤：

定义Transformer编码器，包括位置编码。

调整模型前向传播，使用Transformer处理序列数据。

将Transformer的输出与物理知识编码器的输出进行融合。

保持多任务输出头不变。

注意：Transformer通常需要更多的数据和时间训练，但我们先保持数据生成部分不变。

### Transformer架构的主要改进

#### 1. 核心架构变化

位置编码：显式编码时序位置信息

多头自注意力：全局感受野，捕捉长距离依赖

跨模态注意力：传感器数据与物理知识的深度融合

#### 2. 关键组件

位置编码: self.pos_encoder = PositionalEncoding(d_model)

Transformer编码器: self.transformer_encoder = nn.TransformerEncoder(...)

跨模态注意力融合: self.cross_modal_fusion = CrossModalAttention(...)

#### 3. Transformer优势

全局上下文：自注意力机制捕捉整个序列的依赖关系

并行计算：比RNN更高效的训练

长序列处理：避免梯度消失问题

多尺度特征：不同注意力头学习不同时间尺度的模式

### 预期性能特点

#### 优势：

更好的长期依赖建模：自注意力机制直接连接序列中任意两个位置

更强的表征能力：多头注意力学习丰富的时序模式

更准确的异常检测：全局上下文有助于发现罕见故障模式

#### 潜在挑战：

计算资源需求：Transformer通常需要更多内存和计算

训练数据需求：可能需要更多数据充分训练

超参数调优：注意力头数、层数等需要仔细调整

#### 与LSTM/GRU对比

特性	LSTM/GRU	Transformer

序列建模	递归处理	并行处理

长期依赖	门控机制	直接连接

计算效率	序列长度线性	序列长度平方

位置信息	隐式(状态)	显式编码

可解释性	中等	注意力权重可视化

### Transformer架构结构图

![Transformer架构结构图](./phm_transformer.svg "Transformer") <!-- 相对路径 -->