# Parallelism_Reinforce_CartPole **Repository Path**: AngryPanda_XYZ/Parallelism_Reinforce_CartPole ## Basic Information - **Project Name**: Parallelism_Reinforce_CartPole - **Description**: gym下简单的CarlPole环境作为仿真环境,以reinforce算法作为实例算法,讨论了强化学习在多仿真环境下单步交互并行化设计的可行性,并给出了几种个人设计的架构,同时对各架构的性能进行了一定的分析。 - **Primary Language**: Python - **License**: MIT - **Default Branch**: master - **Homepage**: https://www.cnblogs.com/devilmaycry812839668/p/14221576.html - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2021-01-03 - **Last Updated**: 2021-05-24 ## Categories & Tags **Categories**: Uncategorized **Tags**: 待处理的项目 ## README # Parallelism_Reinforce_CartPole #### 介绍 强化学习中的策略网络算法。《TensorFlow实战》一书中强化学习部分的策略网络算法,仿真环境为gym的CartPole,本项目是对原书代码进行了部分重构,是在以前的版本CartPole_PolicyNetwork项目基础上的改进版本,主要讨论了强化学习在多仿真环境下单步交互并行化设计。本项目分布给出了mode=0,mode=1,mode=2,mode=3共四种并行设计。 #### 软件环境 python3.7, tensorflow-gpu==1.14, gym, numpy #### 软件说明 讨论了强化学习在多仿真环境下单步交互并行化设计,mode_3文件夹下面的为几种设置下的试验结果。