AlphaGo棋风已变,强化学习功不可没

不出所料,AlphaGo又赢了。

人不再是当年那个人,“狗”也不再是当年那只“狗”。

对于今天的棋局,柯洁表现如何AlphaGo的表现又如何,它何以能变得更强?

今天,我们懂围棋的老朋友——CSDN、极客帮创投和AI100的创始人蒋涛,特来详解AlphaGo这次的变化。

同时,李世石的一个学生也凑热闹来做点评。

今天的棋局,柯洁的表现还是值得称赞的。但最后,当然还是毫无悬念就输掉了,这说明人类在准备上,针对AlphaGo还是有不足。

柯洁不是一个人在战斗,应该是中国的围棋界,加上中国的计算机界、AI界来一起迎战人类最强大的对手。如果我们能够打败他,这将是一个非常重磅的新闻。

可是我们现在感觉,柯洁在开局上的套路准备有所不足。50多手下来,其实局面对黑棋(柯洁)来说已经不乐观了。所以,这是反映我们准备不足的一个因素,特别是点三三局面的变化其实并不复杂,但从判断来讲是黑棋(柯洁)不利。

这里是我们对棋局的看法。

AlphaGo棋风已变

聂卫平老师有说,AlphaGo是特意只输半颗子。这一说法我们尚不能证实,但AlphaGo的白棋在后续变化上,相对于人类棋手对局,肯定是下得比较保守的。而另一个角度,柯洁的发挥又相对强势。

因而,最后能出现这么细微的局面,说明棋局还是在AlphaGo的掌控之中的,毕竟它要确保的是结果的胜利。至于胜子1目还是10目,对于电脑来说,这里的判断其实是一样的,都是100%胜利这个结果。

所以,我认为这是两个方面的因素,一是电脑从计算上可能做了适当的退让,这从取胜的角度讲是完全没有问题的;二是柯洁在官子上也下得相对紧凑和精彩。

相对于去年的版本,今年AlphaGo的成长是非常明显的。它有了很多创新的下法,和自己独有的下法,这些下法我们可以从它今天的对局以及年初的Master大战群雄上看出来。

DeepMind创始人哈萨比斯也简单讲过它的细节,AlphaGo今年是单机版,在计算量上是去年的十分之一,但能力上看来比去年提升了不止一点。

用柯洁自己的话说,他有信心战胜去年的AlphaGo,但距离Master与新版AlphaGo的差距是非常显著的。

强化学习功不可没

从新版AlphaGo的表现来看,它更多是在自我学习的成长上,也就是通过强化学习(Reinforcement Learning)和自我对局演化成不同的版本。这样,每一个AlphaGo程序都会有它自己的风格,你可以有意识地诱导它往不同风格去发展。

如果没有不同的风格,强化学习的效果就不会太好。这就相当于你左右互搏,尽管自己和自己下得很多,但风格相近的成长对你未必是好事。而不同风格的成长,就能带来更好的结果。

总的来说,这次的AlphaGo,跟去年相比是很不相同的,棋风也大不一样,下法的创新程度也要高很多。这要归功于它在自我对局中的成长,同时也证明DeepMind在强化学习上的研究和成果是非常有价值的。

AlphaGo为啥这么牛?

视频内容

这是赛前精心准备的AlphaGo视频,我们早就预测过AlphaGo会完胜。

李世石的学生也来凑热闹

第一局比赛开始后,李世石的学生化身 conanbatt,专门出现在 Hacker News 上,来回答硅谷网友的围棋问题:

问题1:AlphaGo面世以来,人类棋手的下法有何变化?

AlphaGo无疑已经改变了围棋领域。专业棋手在围棋领域的竞争是相当激烈的,当棋手研究出一种全新的下法时,必定有另一位棋手会尝试来推翻他。这样的竞争一直在推动着专业围棋的进步。

柯洁在本局所用的点三三开局,是人类棋手在AlphaGo之前从未用过的。我15年前刚学围棋的第一件事,就是不要下出这样的落子。

问题2:AlphaGo之后最重要的问题,就是围棋的未来将会如何?

当然,当前的专业棋手将依旧以围棋为生。不过,在电脑始终能比你下得更好的情况下,再花毕生精力学成专业棋手还有何意义?

在AlphaGo去年打败李世石的时候,我就说过,围棋的未来是在于找对人类仍能进步但AlphaGo却没戏的细微领域。这就是为什么古力、连笑同AlphaGo的配对赛会对我特别有吸引力。

专业棋手与AlphaGo一起合作会有希望打败AlphaGo吗?果真如此的话,人类或许能有一席之地。

问题3:柯洁说再也不想打AlphaGo了,为什么李世石也这么想?

我不认为李世石还想再打。围棋非常依赖于棋手下棋时的信心:专业棋手从不会随意跟业余棋手下围棋,因为一旦输了,会非常他们的心态,使他们在面对其他专业选手时表现得更差。

在2001年的一场专业大赛中,一个阿根廷的业余围棋选手连续击败了两位有实力的专业棋手,这是一个强烈的信号。自那时起,那两位专业棋手基本就告别了专业赛事。

这对专业棋手的打击是巨大的,他们很难赢下自己认定会输的比赛。

说到这里,对于周五的双人AlphaGo配对赛,我们竟有点小小的期待了;至于五人围殴AlphaGo与柯洁获胜的希望,你们觉得还重要吗?

每日荐文

点击下方图片阅读精彩内容

手机也能直接玩机器学习了?大神手把手教你

只要五步,教你撸一个缩减版国际象棋AI

版权申明:如需转载请后台留言征得同意。


原文发布于微信公众号 - AI科技大本营(rgznai100)

原文发表时间:2017-05-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

围棋人机大战一周年:被AlphaGo改变的世界

舒石、若朴 发自 凹非寺 量子位·QbitAI 报道 去年今日,三连败的李世乭扳回一局。 然而这一针兴奋剂很快失效,随后李世乭再折一阵,最终以1:4输给Alph...

3578
来自专栏企鹅号快讯

一年坎坷也曾怀疑自己,如今五冠在手的柯洁将再战AI

柯洁、於之莹任形象大使 中新网客户端北京12月27日电(记者 岳川) 刚刚成为史上最年轻“五冠王”的世界冠军柯洁九段将于明年再战人工智能。柯洁27日表示,弈无止...

18610
来自专栏镁客网

人类又双叒叕输了,就没人能管管这条“狗”吗?

1574
来自专栏新智元

牛津大学教授:AlphaGo Zero的自学能力“可能会出现自发性”

【新智元导读】 根据新智元此前报道, 新一代AlphaGo Zero以100:0打败了AlphaGo。AlphaGo Zero能获得如此战绩,完全通过自学,无需...

3528
来自专栏量子位

人工智能已在赌场赢了100多万美元,德州扑克大战人类又要败了

今天是年三十儿啦,『量子位』祝大家新春快乐!在这亲友相聚的日子里,我们讲一个AI横扫赌场的故事,也挺适合你讲给他们听…… 报道 | 量子位 舒石 ? 百万美...

2576
来自专栏企鹅号快讯

柯洁:重要的不是有没有“食言”,而是不断地打碎和重建

欢迎转发,转载请联系。 “之前在乌镇跟‘AlphaGo’下完之后说我再也不会跟人工智能下棋了,但是现在我食言了。” 昨天上午,柯洁在第一届“吴清源杯”世界女子围...

2066
来自专栏企鹅号快讯

谁说AI会摧毁围棋运动 学棋的人更多了

对于围棋运动而言,行将结束的2017是至关重要的一年。 AlphaGo等人工智能的出现对围棋运动产生了巨大影响,与此同时,围棋的发展也迎来了新机遇。 ? 柯洁在...

2109
来自专栏机器之心

现场报道 | 让天下三子,DeepMind官方解读新版AlphaGo强大实力

机器之心原创 记者:杜夏德 参与:李泽南、吴攀 5 月 23 日,乌镇围棋峰会第一场人机大战以柯洁落败而结束,DeepMind 和谷歌在今天的人工智能高峰论坛中...

34810
来自专栏机器之心

现场报道 | AlphaGo被授职业九段,DeepMind将公开其所有版本细节

机器之心原创 记者:杜夏德 5 月 27 日,经过 3 小时 38 分钟的鏖战,209 手,柯洁盘中投子再负 AlphaGo,至此中国乌镇围棋峰会圆满告落。赛后...

3687
来自专栏CDA数据分析师

人工智能德州扑克读懂人心后,下一个挑谁?

CDA数据分析学院的德州扑克比赛才刚刚结束,就听到AI投来的战书。听说最近人工智能又盯上了德州扑克,最近几天的人机大战也是如火如荼。如果说第一天算是2比2打平手...

2436

扫码关注云+社区