# DQN

**Repository Path**: xj123456/dqn

## Basic Information

- **Project Name**: DQN
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2024-06-15
- **Last Updated**: 2024-06-15

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

pip install gym==0.25.2
pip install parl=2.0.2
pip install paddlepallde-gpu


parl是一个强化学习算法库，对 Agent 进行了框架抽象，
基于三个类实现：Model（网络结构）、Algorithm（与环境交互方式）和 Agent。


深度学习框架使用的是paddle paddle。

reset()方法初始化环境，并使用step()方法执行一个动作，获取环境的反馈。
step()方法返回四个值：观测（observation）、奖励（Reward）、是否结束（Done）和信息（Info）。

gym 是 OpenAI 推出的强化学习实验环境库，本代码用到的环境是CartPole-v0。
该环境的状态数是 4 个，分别为车的位置、车的速度、杆的角度以及杆顶部的速度；
动作数为 2 个，并且是离散的向左或者向右。