# 近端策略优化-月球登录2 **Repository Path**: zozero/proximal-policy-optimization-LunarLander-v2 ## Basic Information - **Project Name**: 近端策略优化-月球登录2 - **Description**: 使用近端策略优化算法的强化学习项目 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2022-11-13 - **Last Updated**: 2022-11-13 ## Categories & Tags **Categories**: Uncategorized **Tags**: 强化学习, PyTorch, AI, AI-人工智能 ## README # 近端策略优化-月球登录训练实例 ## 关于程序 如果你有足够的数学知识,这是一个相当简单,且有趣的项目。\ 不得不说这个项目的效果超出了我的预期,对于新手而言可以尝试一番。\ 命名都为中文,尽可能地贴近其所描述的含义。\ 是我仿照自《强化学习实战系列(2020最新)》唐老师的视频课程所提供的英文源代码(这里没有它)。 ### 文件说明 《强化学习数学公式.docx》这个文件里面是基础的数学公式,我有对公式的组成进行说明;\ 《主要.py》这里是用来来训练的;\ 《测试模型.py》这个是用来测试模型的;\ 《近端策略优化_LunarLander-v2.pth》这个是我自己训练好的模型。 ## 其他 [gym官网](https://www.gymlibrary.dev/),用于强化学习的标准 API,以及各种参考环境的集合,里面集成了不少游戏。