# Reinforcement-Learning **Repository Path**: mllgblgsm/Reinforcement-Learning ## Basic Information - **Project Name**: Reinforcement-Learning - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-01-03 - **Last Updated**: 2021-01-03 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 强化学习的博客及配套代码 记录自己强化学习由浅入深的学习过程,目前主要参考的资料是David Silver的公开课,下面提到的代码有部分源于网络。 ## [目录](#目录) - [强化学习博客与代码](#强化学习博客与代码) ## 强化学习博客与代码: |**博客** | **代码** | | --------------------------------------------------------------------------------------------- |:-------------:| | [强化学习-术语和数学符号](https://blog.csdn.net/u011254180/article/details/84031546) | 无 | | [强化学习(一)简介](https://blog.csdn.net/u011254180/article/details/83349455) | 无 | | [强化学习(二)马尔科夫决策过程](https://blog.csdn.net/u011254180/article/details/83387344) | 无 | | [强化学习(三)动态规划寻找最优策略](https://blog.csdn.net/u011254180/article/details/83573220) | 无 | | [强化学习(四)不基于模型的预测](https://blog.csdn.net/u011254180/article/details/83994391) | 无 | | [强化学习(五)不基于模型的控制](https://blog.csdn.net/u011254180/article/details/84253095) | 无 | | [强化学习实践(一)Tic-Tac-Toe游戏](https://blog.csdn.net/u011254180/article/details/86479795) | [代码](/01-blog_code/Tic-Tac-Toe/example.py) | | [强化学习实践(二)迭代法评估4\*4方格世界下的随机策略](https://blog.csdn.net/u011254180/article/details/88133551) | [代码](/01-blog_code/Gridworld/gridworld.py) | | [强化学习实践(三)理解gym的建模思想](https://blog.csdn.net/u011254180/article/details/88211536) | 无 | | [强化学习实践(四)编写通用的格子世界环境类](https://blog.csdn.net/u011254180/article/details/88220484) | [代码](/01-blog_code/Gridworld2/gridworld2.py) | | [强化学习实践(五)Agent类和SARSA算法实现](https://blog.csdn.net/u011254180/article/details/88430601) | [代码](/01-blog_code/sarsa/sarsa.py) | | [强化学习实践(六)SARSA(λ)算法实现](https://blog.csdn.net/u011254180/article/details/88673519) | [代码](/01-blog_code/sarsa/sarsa(lambda).py) | | [强化学习(六)价值函数的近似表示](https://blog.csdn.net/u011254180/article/details/89238765) | 无 | | [强化学习实践(七)给Agent添加记忆功能](https://blog.csdn.net/u011254180/article/details/89326920) | [代码](/01-blog_code/core/core.py) | | [强化学习(七)策略梯度](https://blog.csdn.net/u011254180/article/details/89431822) | 无 | | [强化学习(八)整合学习与规划](https://blog.csdn.net/u011254180/article/details/89556617) | 无 | | [强化学习(九)探索与利用](https://blog.csdn.net/u011254180/article/details/90063387) | 无 | | [强化学习实践(八)DQN的实现](https://blog.csdn.net/u011254180/article/details/90240163) | [代码](/01-blog_code/dqn/approxagent.py) |