# 强化学习之超级马里奥

**Repository Path**: zozero/A3C-super-mario

## Basic Information

- **Project Name**: 强化学习之超级马里奥
- **Description**: 强化学习之超级马里奥，异步优势行动者与评论家
- **Primary Language**: Unknown
- **License**: MIT
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 2
- **Forks**: 1
- **Created**: 2022-12-05
- **Last Updated**: 2025-05-18

## Categories & Tags

**Categories**: Uncategorized

**Tags**: PyTorch, AI-人工智能, AI, 强化学习, a3c

## README

# 超级马里奥
### 异步优势行动者与评论家
## 关于程序
很有趣的项目，但训练需要很长时间，训练花了10个小时左右。\
没有训练完善的网络模型测试时会卡在某个柱子前，或者某个台阶上，经过很长很长时间后它才学会跳过去......\
命名都为中文，尽可能地贴近其所描述的含义。\
中英文对照：异步优势行动者与评论家(A3C,Asynchronous Advantage Actor-critic)。\
是我仿照自《强化学习实战系列（2020最新）》唐老师的视频课程。
## 文件说明
《训练.py》这里是用来训练的。\
《测试.py》这里是用来测试的。\
《超级马里奥_1_1_已完成》这是我训练好的模型，它在《已训练的模型》目录下。\
《强化学习之异步优势行动者与评论家.docx》这个文件里面是基础的数学公式，我有对公式的组成进行说明。你可能不会理解我写了什么，事实上我重读的时候也是这样：）。
## 注意事项
你需要安装[Gym](https://gymnasium.farama.org/)，[gym-super-mario-bros](https://github.com/Kautenja/gym-super-mario-bros)（专用于马里奥游戏的库）。\
如果在win11系统下保存出现乱码或者报错，请参考[链接](https://blog.csdn.net/wry15082983136/article/details/126229608)的方法。\
使用tensorboardX需要安装tensorflow，然后在控制台执行命令`python -m tensorboard.main --logdir=./张量板/超级马里奥`
## 其他
一个用于使用中文编程，很好用的pycharm插件[链接](https://github.com/tuchg/ChinesePinyin-CodeCompletionHelper)。