刚刚,柯洁再次惜败国产围棋AI,星阵到底是何方神圣?

策划编辑 | Natalie

撰文 | Vincent,Debra

AI 前线导读:2018 年 4 月 27 日,与 AlphaGo 交手一年之后,棋士柯洁再次迎战 AI 棋手,这次的对手又是国产的 AI 棋手,名曰:“星阵”。这是柯洁第三次与 AI 棋手对阵,在棋局进行到 1 小时 50 分左右的时候,柯洁认输,随后双方收盘离场。盘点一年多来的数次对战,AI 棋手在围棋领域似乎难再有人类对手。

更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front)

棋手柯洁中盘认输 AI 棋手

柯洁又跟 AI 棋手对阵了!

在刚知道这则消息的时候,相信大多数人的内心是有些惊讶的,号称“不再跟 AI 下棋”的棋士柯洁居然又跟 AI 杠上了。

其实柯洁在当初与 AlphaGo 对阵之后,虽然表示不再与 AI 棋手对阵,但是他同时还表示过愿意在围棋领域的 AI 研究上贡献一部分自己的力量,so,这次的比赛,与其说是“人机大战”,不如说是一场人类对 AI 棋手的测试吧。

本次比赛采用中国围棋规则,黑贴 3 又 3/4 子,用时为每方 2 小时,保留五次一分钟读秒。裁判由 2016 年 AlphaGo 与李世石人机大战的裁判长樊麾担任。随着中国围棋协会主席林建超的一声宣布,比赛正式开始。星阵围棋第一作者金涬博士担任“人肉臂”,落下了星阵的第一颗黑子。

星阵围棋第一作者 金涬

自从第一次 AlphaGo 与李世石的人机大战之后,职业棋手们就开始对围棋人工智能进行了深入研究。普遍认为把棋局导向复杂的战斗,人类棋手取胜的概率会更大。今天执白的柯洁选择了“宇宙流”开局,做出一块巨大的模样。黑棋打入之后,双方展开了惊心动魄的“短兵相接”。

柯洁白棋的大模样布局

柯洁攻杀黑棋大龙非常坚决,但星阵下得非常灵活,弃掉数子,破掉了白棋的潜力,全局实地黑棋领先不少。

柯杰又挠头

局势不利之下,柯洁做出一个劫争,寻求变化。但星阵计算精准,借打劫的机会,活出了此前阵亡的大龙。柯洁见强杀无望,遗憾投子。

让我们简要回顾一下柯洁经历过的三次“人机大战”:

2017 年 5 月 23 日,柯洁于杭州乌镇迎战升级版 AlphaGo,首日以 4/1 子遗憾落败,总比分以 3:0 败于 AlphaGo。

2018 年 1 月 17 日,柯洁对阵国产 AI 棋手“绝艺”,在 AI 让二子的情况下,柯洁依然惨遭碾压,在 77 手时告负。

2018 年 4 月 27 日,柯洁对阵国产 AI 棋手“星阵”,中盘认输。

不过,柯洁也并非只有败绩,在 1 月 24 日与“绝艺”的另一局对阵中,柯洁在 72 手时力挫对手,完成了一次漂亮的复仇。

国产 AI 棋手“星阵”到底是何方神圣

今天下午三点与柯洁九段对战的星阵是深客科技有限公司开发的围棋人工智能程序,它的前身是清华大学研发的“神算子”,曾在比赛中战胜世界冠军孔杰九段。在赛前网上热身中,星阵与职业棋手进行 30 盘大战,取得了 28 胜 2 负的佳绩,对阵的棋手包括周睿羊、朴廷桓等世界冠军。因此在本次赛前预测中,专家普遍认为柯洁战胜星阵将是“小概率事件”。

此前,清华 AI 神算子的程序作者由小川曾说过,星阵的前身神算子开发中特别注重深度学习算法上的研究和挖掘,而星阵的开发团队也曾透露它的两个特点:第一,星阵围棋学习和借鉴了 AlphaGo 的基本架构,但在特征体系、模型结构、MCTS 算法架构等方面有所创新,力争用更少的计算资源和更少的训练样本完成模型学习,赶超人工智能围棋的最高水平,比如可以下出更容易让人理解和学习的围棋,下出优势下不退让的围棋,进行任意棋盘路数的对局,也可以进行任意贴目数的对局。我们知道,助力 Alpha Go 打败人类的是一大利器是强化学习技术,但星阵所用的技术却另辟蹊径,这是“星阵”超越 Alpha Go 的地方。第二,它由中国人工智能团队倾心打造。

相比大家都很熟悉的 AlphaGo,星阵到目前为止还是显得有些神秘,关于它背后开发团队的具体情况、所采用的技术细节都未曾对外界详细透露过。

星阵这个有特点的名字其实是围棋的别称之一。围棋棋盘有 361 个交叉点,中心点“天元”象征着混元一周天的度数,棋盘上的九个星标座与易理八卦相通,整个棋局用黑白两种符号组合排列,隐含太极阴阳。每颗棋子着在棋盘上,象征星星在周天排列阵势,借喻指围棋。据说“星阵”命名还有另一层意思,只是星阵团队暂时并未透露。

在星阵之前,回顾围棋 AI 的历史,多个围棋 AI 的表现一次次刷新了人们对 AI 的期望值。其中,AlphaGo 可以说是围棋 AI 领域一座划时代的里程碑了,甚至引起了一阵对机器有一天将会控制人类的恐慌。AlphaGo 在“人机大战”第一回以 4:1 大胜世界冠军李世石打响了名声,之后化名 Master 打败网络“无敌手”,紧接着在“人机大战”第二回完胜柯洁。再到 2017 年 10 月,Deepmind 又公布了最新研究成果 AlphaZero,该算法可以进行自我对弈训练,仅通过 72 小时内 490 万对局的训练就用 100:0 击败了初代 AlphaGo,进步神速。

除了 AlphaGo,绝艺、天壤等围棋 AI 同样名声广播。在 2017 年 12 月 10 日的第一届围棋 AI 龙星战(AI RYUSEI)中,绝艺(中国)、DeepZenGo(日本)和天壤分别瓜分了冠、亚、季军。

腾讯 AI Lab 研发的绝艺诞生于 2016 年 3 月,其研发团队透露其使用了蒙特卡洛搜索树技术,而这正是 AlphaGo 的核心技术之一,也是其取得突破的关键。

由中国 AI 公司天壤智能团队研发的天壤智能围棋,正是在 CGOS 上以 89 胜 5 负战绩迅速爬升的 define-3.0。天壤团队在赛后采访中公布了 define-3.0 的一些细节,坦诚天壤围棋参考了最新发表的 DeepMind 论文,通过机器自我学习提升模型的能力。

这么看来,包括绝艺在内,AlphaGo 及之后的围棋人工智能可以认为都是“同宗同源”。而这次,星阵是否也会延续这一“血统”?

写在最后

从首次对阵 AlphaGo 之后的泪洒现场,到与绝艺对阵之后的无语凝噎,再到今天对比赛的淡然一笑,棋士柯洁一直在不断成长。

此图截取自柯洁微博文章

同样的,他的对手,这些 AI 棋手们也在不断学习实战经验而成长。对于围棋这样需要大量计算的领域,人类与 AI 的对战已经没有太多意义,“人机大战”这样的比赛持续举办,目的是增进双方的技术水平。比如“绝艺”已经成为中国围棋国家队的训练工具,相信未来它还会被应用在更多领域。

正如 DeepMind 创始人,AlphaGo 之父——Demis Hassabis 所说:“我们希望 AlphaGo 在未来能够成为一个工具,这不是人机大战,而是人使用电脑发现新的奥秘和知识。和哈勃望远镜一样,探索宇宙,AlphaGo 就是新的哈勃望远镜。我们最终的目的不是谁赢,因为最终的胜利属于人类。”

今日荐文

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180427G1BFAE00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券