代码拉取完成,页面将自动刷新
基于深度强化学习的AI网球agent探索,提供游戏环境、AI决策的全部源码,欢迎加入共同完善项目。
目前项目已经完成了初步的训练,采用D-DQN系列的方法,取得了阶段性的成绩——战胜人类玩家。 仓库负责人通过大量的实验,并且让20名资深游戏玩家在试玩训练一小时后开始对局,最优秀的“ 人类 vs AI ”战绩为30:100.
项目采取C/S架构。server端为worldmodel,负责对agent的动作进行注册,执行,并且维护了球场的环境。angent通过server来获取球场的参数。 angent为客户端,即为球员。开发者通过编写球员的决策代码,可以完成对球员的比赛策略进行编写(在与人类对局的时候,其中一个agent的决策由键盘操控)。
pytorch>=1.6 python>=3.7.1 PyQt5
python ./trainer.py
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。