前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >最懂机器学习的围棋高手,解读柯洁首战AlphaGo时的失误

最懂机器学习的围棋高手,解读柯洁首战AlphaGo时的失误

作者头像
AI科技大本营
发布2018-04-27 14:10:40
8190
发布2018-04-27 14:10:40
举报

解读柯洁大战AlphaGo,当然离不开围棋界最懂机器学习的高手。

本次,我们很荣幸邀请到围棋队的电脑专家——余平大师,来为我们讲解第一盘人机大战。

首先,当然从围棋的角度出发,余平大师认为,柯洁选AlphaGo的“点”三三是非常非常错误的。

“点”完三三,然后一“爬”的时候,以前胡耀宇写过一个“扳”,然后“扳”了“退”,所以说不好;事实上今天AlphaGo一“飞”,其实几十年就已证明过“飞”比“扳”要便宜一点点。

其次,他还认为柯洁没有抓住第37手的机会,非常可惜。

柯洁在36手AlphaGo“挤”他的时候,让角被吃掉,这肯定不是好棋。他应该下在43手的位置,“小尖”守住那个角,同时白棋(AlphaGo)也就吃不掉他。然后白棋大概会断打,之后会形成一个围大模样的状态,你就可以打进去……这是最好的对付机器的方法。

因为吃棋,那它蒙特卡洛算法就全没用了,你就得逻辑地、算法很精准地把它吃掉,这才是取胜之道。

第三点,这位最懂机器学习的围棋大师认为,要战胜AlphaGo的唯一出路,是用逻辑搜索代替概率搜索。

当然就是,你开始亏了,这个压过来,到底谁好谁不好,我就不知道了。但是你形成了一个大模样,然后你再打进去,这就把棋局变成逻辑搜索了。要是概率搜索的话,人肯定已经输了。那块棋就是在决生死了,只要你能活,AlphaGo就完了。

第四个观点,是我们的围棋爱好者蒋涛老板提出来的,他问了引发大规模战斗会有机会吗?那模仿棋会有机会吗?我们一起来听听余平大师的解读。

对,所以还是应该引发大规模的战斗。这主要是因为,最后的评定胜负要用“死活”来决定,才能有机会。

没有死活的话,蒙特卡洛树的搜索效率,人是没有办法做到的。官子的时候,它整个扣死你半目,你就没有办法了。

你必须要把它导入到对手来杀你的那条长龙中,那是最危险、同时也是最关键的时候。

下场就要看他是不是下模仿棋,不下模仿棋就根本没戏了。

从AlphaGo的角度讲,对付模仿棋需要特别的算法,这一点AlphaGo应该有做。但模仿棋会造成的影响是,双方的棋面会差不太多,即使最后你变招的时候也会差不太多,最后收官的时候,它又可能会变成逻辑搜索的状态,而不是概率搜索,只要错一点,这盘你就输了。

每日荐文

点击下方图片阅读精彩内容

David Silver深度强化学习课程 06—值函数近似(中文字幕)

David Silver深度强化学习课程 07—策略梯度算法(中文字幕)

版权申明:如需转载请后台留言征得同意。


本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-05-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档