1 Star 0 Fork 0

张杰/pytoch_gradio

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
train_and_save.py 6.36 KB
一键复制 编辑 原始数据 按行查看 历史
张杰 提交于 2024-04-25 09:23 . 1
import torch # 引入PyTorch,用于构建和训练神经网络模型
import torch.nn as nn # 引入torch.nn,用于定义神经网络层和损失函数
import torch.optim as optim # 引入torch.optim,用于定义优化器
from torchvision import datasets, transforms # 引入torchvision,用于加载和转换数据集
from torch.utils.data import DataLoader # 引入DataLoader,用于创建数据加载器
# 定义数据转换,将图像转换为张量并进行归一化
transform = transforms.Compose([
transforms.ToTensor(),
transforms.Normalize((0.1307,), (0.3081,))
])
# 加载MNIST训练集和测试集,并应用数据转换
train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
test_dataset = datasets.MNIST(root='./data', train=False, download=True, transform=transform)
# 将训练集划分为训练集和验证集
train_size = int(0.8 * len(train_dataset))
val_size = len(train_dataset) - train_size
train_dataset, val_dataset = torch.utils.data.random_split(train_dataset, [train_size, val_size])
# 创建数据加载器,用于批次化和随机化数据
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False)
# 定义多层感知机模型
class MLP(nn.Module):
def __init__(self):
super(MLP, self).__init__()
self.flatten = nn.Flatten() # 定义数据展平层,将二维图像数据转换为一维向量
self.fc1 = nn.Linear(784, 20) # 定义第一个全连接层,输入维度为784,输出维度为20
self.relu = nn.ReLU() # 定义ReLU激活函数
self.fc2 = nn.Linear(20, 10) # 定义第二个全连接层,输入维度为20,输出维度为10
def forward(self, x):
x = self.flatten(x) # 将输入数据展平为一维向量
x = self.fc1(x) # 通过第一个全连接层
x = self.relu(x) # 应用ReLU激活函数
x = self.fc2(x) # 通过第二个全连接层并输出结果
return x
# 创建多层感知机模型实例
model = MLP()
# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss() # 定义交叉熵损失函数,用于计算模型输出与真实标签之间的差异
optimizer = optim.Adam(model.parameters(), lr=0.001) # 定义Adam优化器,用于更新模型参数
# 训练模型
num_epochs = 20 # 设置训练的总轮数为20
for epoch in range(num_epochs): # 开始训练循环,每次循环称为一个epoch
# 训练阶段
model.train() # 将模型设置为训练模式,启用BatchNormalization和Dropout
train_loss = 0.0 # 初始化训练损失为0
train_acc = 0.0 # 初始化训练准确率为0
for images, labels in train_loader: # 遍历训练数据加载器,每次处理一个批次的数据
outputs = model(images) # 将当前批次的图像输入到模型中,得到预测输出
loss = criterion(outputs, labels) # 使用损失函数计算预测输出和真实标签之间的损失
optimizer.zero_grad() # 清零模型参数的梯度,为下一次梯度计算做准备
loss.backward() # 反向传播计算损失函数关于模型参数的梯度
optimizer.step() # 使用优化器更新模型参数,根据计算得到的梯度优化模型
train_loss += loss.item() * images.size(0) # 累加当前批次的训练损失,乘以批次大小得到样本总损失
_, predicted = torch.max(outputs.data, 1) # 获取预测概率最大的类别索引
train_acc += (predicted == labels).sum().item() # 统计预测正确的样本数
train_loss /= len(train_dataset) # 计算平均训练损失,除以训练集总样本数
train_acc /= len(train_dataset) # 计算训练准确率,除以训练集总样本数
# 验证阶段
model.eval() # 将模型设置为评估模式,禁用BatchNormalization和Dropout
val_loss = 0.0 # 初始化验证损失为0
val_acc = 0.0 # 初始化验证准确率为0
with torch.no_grad(): # 关闭梯度计算,减少内存消耗和加速计算
for images, labels in val_loader: # 遍历验证数据加载器,每次处理一个批次的数据
outputs = model(images) # 将当前批次的图像输入到模型中,得到预测输出
loss = criterion(outputs, labels) # 使用损失函数计算预测输出和真实标签之间的损失
val_loss += loss.item() * images.size(0) # 累加当前批次的验证损失,乘以批次大小得到样本总损失
_, predicted = torch.max(outputs.data, 1) # 获取预测概率最大的类别索引
val_acc += (predicted == labels).sum().item() # 统计预测正确的样本数
val_loss /= len(val_dataset) # 计算平均验证损失,除以验证集总样本数
val_acc /= len(val_dataset) # 计算验证准确率,除以验证集总样本数
# 打印当前epoch的训练损失、训练准确率、验证损失和验证准确率
print(f"Epoch [{epoch+1}/{num_epochs}], Train Loss: {train_loss:.4f}, Train Acc: {train_acc:.4f}, Val Loss: {val_loss:.4f}, Val Acc: {val_acc:.4f}")
# 在测试集上评估模型
model.eval() # 将模型设置为评估模式
with torch.no_grad(): # 关闭梯度计算
correct = 0
total = 0
for images, labels in test_loader: # 遍历测试数据加载器
outputs = model(images) # 将测试图像输入到模型中,得到预测输出
_, predicted = torch.max(outputs.data, 1) # 获取预测概率最大的类别索引
total += labels.size(0) # 累加测试样本总数
correct += (predicted == labels).sum().item() # 统计预测正确的样本数
accuracy = correct / total # 计算测试准确率
print(f"Test Accuracy: {accuracy:.4f}") # 打印测试准确率
# 从测试集中选择前两个样本作为推理数据
x_infer, _ = next(iter(test_loader))
x_infer = x_infer[:2]
# 使用训练好的模型对推理数据进行预测
model.eval() # 将模型设置为评估模式
with torch.no_grad(): # 关闭梯度计算
y_infer = model(x_infer) # 将推理数据输入到模型中,得到预测输出
_, predicted = torch.max(y_infer.data, 1) # 获取预测概率最大的类别索引
# 保存模型参数
torch.save(model.state_dict(), 'best_mlp_model.pt')
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/zj17387451265/pytoch_gradio.git
git@gitee.com:zj17387451265/pytoch_gradio.git
zj17387451265
pytoch_gradio
pytoch_gradio
master

搜索帮助