使用AlphaGo Zero算法下五子棋系列教程预告

最近AlphaGo太鸡儿火了了,于是咱也去凑一把热闹。

AlphaGo算法最初对战李世石的时候使用了一些围棋棋谱进行了监督学习。两个月前DeepMind又推出了AlphaGo Zero算法,把它改进成了不需要棋谱数据的无监督学习。上个月再次推出了Alpha Zero算法,用来下国际象棋。

接下来的一系列教程将会一步一步的教大家使用python,完成AlphaGo Zero算法。由于个人计算机算力的问题,我们在这里学习五子棋这样一个简单的任务。

这一系列教程由 部分组成:

1、什么是蒙特卡洛树搜索

2、自己用python手写一个五子棋类

3、蒙特卡洛树搜索五子棋AI

4、ResNet

5、AlphaGo Zero算法详解

6、使用Pytorch制作AlphaGo Zero

7、给五子棋加上一个看得过去的UI吧

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180124G0DCBZ00?refer=cp_1026

相关快讯

扫码关注云+社区