# DQN **Repository Path**: xj123456/dqn ## Basic Information - **Project Name**: DQN - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-06-15 - **Last Updated**: 2024-06-15 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README pip install gym==0.25.2 pip install parl=2.0.2 pip install paddlepallde-gpu parl是一个强化学习算法库,对 Agent 进行了框架抽象, 基于三个类实现:Model(网络结构)、Algorithm(与环境交互方式)和 Agent。 深度学习框架使用的是paddle paddle。 reset()方法初始化环境,并使用step()方法执行一个动作,获取环境的反馈。 step()方法返回四个值:观测(observation)、奖励(Reward)、是否结束(Done)和信息(Info)。 gym 是 OpenAI 推出的强化学习实验环境库,本代码用到的环境是CartPole-v0。 该环境的状态数是 4 个,分别为车的位置、车的速度、杆的角度以及杆顶部的速度; 动作数为 2 个,并且是离散的向左或者向右。