代码拉取完成,页面将自动刷新
这个是一个copy别人的项目,我做了一下简单的翻译,我的关注点是在TensorFlow下alphaZero,所去除其他的介绍 项目使用eclipse+PyDev+TensorFlow
这个项目是根据AlphaZero的算法完成的一个五子棋游戏,通过对弈训练,不断增强自己。通过在pc端的几个小时的训练就 可以实现比较好的对弈效果。通过她,我们可以把主要的精力放在AI模型算法上面
相关知识:
Python >= 2.7
Numpy >= 1.11
TensorFlow
PS: 如果想要使用其他的框架训练,需要自己重新policy_value_net.py
如果想和训练后的模型进行对弈,运行
python human_play.py
重新训练模型运行
python train.py
要注意修改文件头的引用
from policy_value_net import PolicyValueNet # Theano and Lasagne
训练时使用CPU还是GPU : python train.py
(To use GPU in PyTorch, set use_gpu=True
)
关于模型训练的建议:
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。