MADDPG 的 tensorflow2.0实现
环境 MPE
对MPE环境进行了一些简单的修改,目前只在MPE中的simple_spread上进行了简单的测试
MADDPG代码
代码由于是自己写的,可能有一些错误,欢迎评论指出。
已经上传到了GitHub上,maddpg代码,直接clone下来即可。
项目路径如下图所示(run64_3是存储运行文件的,刚下载下来没有):
![在这里插入图片描述](https://img-blog.csdnimg.cn/baea1ed993e64ae1baaf51c4c4a9e94d.png#pic_center)
运行mpe_train文件,运行过程截图:
![在这里插入图片描述](https://img-blog.csdnimg.cn/2f3e4aa0985f48189c5094e993bf2dab.png#pic_center)
超参数采取文件内的设置,运行1000次,结果如下:
下图是使用matplotlib绘制的。
![在这里插入图片描述](https://img-blog.csdnimg.cn/d149539f7f4b42f9a6a1607eba7c207a.png#pic_center)
使用tensorboard绘制的结果如下:
![在这里插入图片描述](https://img-blog.csdnimg.cn/ad419546e59c41fda664c2fa22824b29.png#pic_center)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)