# Parallelism_Reinforce_CartPole

**Repository Path**: AngryPanda_XYZ/Parallelism_Reinforce_CartPole

## Basic Information

- **Project Name**: Parallelism_Reinforce_CartPole
- **Description**: gym下简单的CarlPole环境作为仿真环境，以reinforce算法作为实例算法，讨论了强化学习在多仿真环境下单步交互并行化设计的可行性，并给出了几种个人设计的架构，同时对各架构的性能进行了一定的分析。
- **Primary Language**: Python
- **License**: MIT
- **Default Branch**: master
- **Homepage**: https://www.cnblogs.com/devilmaycry812839668/p/14221576.html
- **GVP Project**: No

## Statistics

- **Stars**: 1
- **Forks**: 0
- **Created**: 2021-01-03
- **Last Updated**: 2021-05-24

## Categories & Tags

**Categories**: Uncategorized

**Tags**: 待处理的项目

## README

# Parallelism_Reinforce_CartPole

#### 介绍
强化学习中的策略网络算法。《TensorFlow实战》一书中强化学习部分的策略网络算法，仿真环境为gym的CartPole，本项目是对原书代码进行了部分重构，是在以前的版本CartPole_PolicyNetwork项目基础上的改进版本，主要讨论了强化学习在多仿真环境下单步交互并行化设计。本项目分布给出了mode=0,mode=1,mode=2,mode=3共四种并行设计。


#### 软件环境
python3.7,
tensorflow-gpu==1.14,
gym,
numpy


#### 软件说明
讨论了强化学习在多仿真环境下单步交互并行化设计，mode_3文件夹下面的为几种设置下的试验结果。