# MADDPG_based_on_Pytorch

**Repository Path**: flba666/MADDPG_based_on_Pytorch

## Basic Information

- **Project Name**: MADDPG_based_on_Pytorch
- **Description**: 基于pytorch的MADDPG算法代码，使用MPE粒子球环境
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 3
- **Forks**: 0
- **Created**: 2023-02-22
- **Last Updated**: 2025-03-06

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# MADDPG_based_on_Pytorch
# This object is based on Pytorch , and I refer to the PARL.
'''
    由于对于多智能体强化学习的需要，用pytorch写了这一篇基于MPE环境的MADDPG算法。
    之前做毕业设计时候，作者主要通过MADDPG论文附带的代码以及百度的PARL库了解MADDPG，论文中附带的代码
基于Tensorflow, PARL则运用了自家的paddle库，因此作者很久之前就想要再写一份基于torch的MADDPG, 刚好借
着这次深入了解MADDPG算法的契机，作者学习先辈们的经验，创作了这份代码。
    注:本项目主要参考PARL(其中有小部分函数实现使用了PARL以及paddle的方法),
    PARL链接:https://github.com/PaddlePaddle/PARL.git
'''
# 项目结构
'''
    项目主要分为四部分:
    model.py # 模型
    alg.py  # MADDPG算法
    agent.py  # 智能体
    train.py  # 训练主函数
    para.py  # 参数
    replay_memory.py  #  经验池
    function.py  # 一些其他函数
    difference in torch and paddle with parl  # 作者的一些总结
 '''
 
 # python环境
 '''
    gym==0.10.5
    numpy==1.19.2
    torch==1.7.1+cu110
    https://github.com/openai/multiagent-particle-envs
    python==3.7
  '''
  
  # 本项目属于学习用，如果有错误或不严密的地方，欢迎大家留言指正