求AlphaGo Zero用paddle写的案例
收藏
哪位大神,能分享一份AlphaGo Zero用paddle实现的案例吗,简洁版就可以哦,学习下思路,谢谢!(是AlphaGo Zero,不是AlphaGo,有区别哦)
0
收藏
请登录后评论
如果有,我也想学习下
我发现了一个五子棋的,在学习,分享给你试试:https://zhuanlan.zhihu.com/p/32089487
思路的话GitHub上有很多,但不是paddle,不过既然是思路~那应该没问题,没准你写成paddle访问量还会挺大
上学时,我第一个写的有点“智能”的程序就是用策略加权的方式求解次优步的苹果棋游戏~~~
哦,是强化学习
8线五子棋可以在没有tpu的情况下体会下算法了
去git找找看
就算不是用paddle写的,自己看懂了也可以重写不是,反正花不了太多时间
这是官方提供的parl框架用AlphaZero网络玩Connect 4游戏的例子,可惜连百度官方用的都是torch,现在parl框架应该实现不了吧?
https://github.com/PaddlePaddle/PARL/tree/524ba6f639465040c688426012febe954a9dba6d/benchmark/torch/AlphaZero
pp目前没有
mark 一下,学习学习
学习学习