# 近端策略优化-月球登录2

**Repository Path**: zozero/proximal-policy-optimization-LunarLander-v2

## Basic Information

- **Project Name**: 近端策略优化-月球登录2
- **Description**: 使用近端策略优化算法的强化学习项目
- **Primary Language**: Unknown
- **License**: MIT
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2022-11-13
- **Last Updated**: 2022-11-13

## Categories & Tags

**Categories**: Uncategorized

**Tags**: 强化学习, PyTorch, AI, AI-人工智能

## README

# 近端策略优化-月球登录训练实例
## 关于程序
如果你有足够的数学知识，这是一个相当简单，且有趣的项目。\
不得不说这个项目的效果超出了我的预期，对于新手而言可以尝试一番。\
命名都为中文，尽可能地贴近其所描述的含义。\
是我仿照自《强化学习实战系列（2020最新）》唐老师的视频课程所提供的英文源代码（这里没有它）。
### 文件说明
《强化学习数学公式.docx》这个文件里面是基础的数学公式，我有对公式的组成进行说明；\
《主要.py》这里是用来来训练的；\
《测试模型.py》这个是用来测试模型的；\
《近端策略优化_LunarLander-v2.pth》这个是我自己训练好的模型。
## 其他
[gym官网](https://www.gymlibrary.dev/)，用于强化学习的标准 API，以及各种参考环境的集合，里面集成了不少游戏。