首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

阿尔法元动了谁的奶酪

2017年10月,《自然》(Nature)杂志刊出了谷歌Deep Mind团队的新成果。他们推出的新一代围棋人工智能程序阿尔法元(Alpha Go Zero)以100比0的绝对优势战胜上一代人工智能围棋程序阿尔法狗(Alpha Go)。关键是,阿尔法元是在没有人类经验指导的情况下,仅仅凭借围棋基本规则和自我学习而获得了高超的围棋技能。这一胜绩再一次引起公众的震惊和担忧。人们担忧的是,计算机可以不需要人类经验作基础,却远远高于人类学习的水平。这似乎在说,人类的智力已经远远不敌计算机了。在计算机的智力飞速发展的情况下,人类的生存价值和活动空间不可避免地会被这种“更聪明”的人工智能所侵占。目前我们遭遇的事实真的是这样的吗?“阿尔法们”真的来抢人类的奶酪了吗?

如何理解“阿尔法们”的胜利

从阿尔法狗到阿尔法元,计算机的围棋技艺进步神速。但是,这两代阿尔法的胜利究竟意味着什么呢?

在新闻报道中,我们读到这样的叙述: Alpha Go Zero仅用一张神经网络、一台机器和4个TPU,经过自我对弈式的训练,在3天的时间里实现了近500万局自我对弈,便能够超越人类并打败之前的Alpha Go版本。谷歌Deep Mind团队总结道:Alpha Go Zero相比与Alpha Go 的更强大之处在于:“它再也不会受到人类经验的限制,而是可以不断向世界上最强的围棋手——也就是它自己学习到非既定的能力。”

当Alpha Go战胜人类棋手时,人们还可以这样安慰自己:因为Alpha Go是学习了大量人类棋手的实际对弈棋局而获得了下棋的技能,它战胜了某一个棋手其实意味着人类的整体知识和智能的积累战胜了一个个别的人。所以,对棋手个人而言,败给Alpha Go可以说虽败犹荣。但是这一次,Alpha Go Zero完全不从人类的经验中学习,而是仅仅依靠最初的几条围棋基本规则,通过自我对弈的方式自我训练,三天自我对弈500万盘(这个数字与上一代Alpha Go学习了海量棋局,并且自我对弈3000万盘,历经数月训练相比,可谓进步神速)就取得斐然的成就。这很容易让人做出这样的解释,上一代的Alpha Go不敌新一代的Alpha Go Zero,是因为从人类智能中学习的Alpha Go败给了师从纯粹人工智能的Alpha Go Zero,人类的知识或智能限制了Alpha Go的学习,而在抛弃了人类的经验制约以后,计算机的智能可能远远把人类抛在后面。也就是说,这是人类智能对人工智能的失败。

面对这样的担忧,人类比以往更加需要确证自己的存在价值。这种确证开始于对“智能”的理解。于是,我们不禁要追问:人工智能的“智能”的真正含义是什么呢?

首先,人工智能在根本上是“计算机”。因此,它们在计算任务上超过人类并不应是一件需要担忧的事件,而应是值得高兴的事件。正如人类制造了汽车——可以被称为“移动机”。当汽车的移动速度远远超过人的极限时,并没有人为此担忧人类移动能力的价值受到了威胁。计算机最初被发明出来,是为了让它帮人处理“按照既定规则进行计算”的任务。计算机在计算任务上超越人类,正像汽车的移动能力超越人类一样,它们所体现出来的“优势”不正是由人类智能所“创造”的吗?

其次,对弈是人类发明的一种智力游戏。这类游戏的共同特征是有明确的规则和清晰的边界,并且对游戏的最后成果有精确的衡量指标。对弈双方必须在规则和边界的限制下,通过合理性计算而实现“赢棋”的目标。这样的活动是“结构良好任务”。针对结构良好任务,解决办法是按照既有的规则“计算”尽可能多的中间状态,并对每一种中间状态的效价进行评估,并选择最佳的路径。对弈者能够评估的中间状态越多,赢棋的可能性就越大。但是这种评估显然受到计算能力的限制。我们把计算过程中的中间状态的总和称为“问题空间”,那么初始规则越少,问题空间就越大。在人类的棋类游戏中,围棋是初始规则最简单、棋盘格子最多的一种,所以,围棋对弈计算的问题空间非常巨大。在Alpha Go诞生之前,有很多人相信计算机的计算能力无法处理围棋的问题空间。谷歌的研究团队在计算方式上的革新让计算机的计算能力有了长足的进步,所以才有了战胜人类棋手的成绩。但是我们也应该看到Alpha Go和新一代的Alpha Go Zero所处理的都是“结构良好问题”。解决结构良好问题的关键是计算能力,所以,两代Alpha Go的成就其实是基于计算能力的提升。那么,计算能力能不能等同于人类的“智能”呢?

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180227C094SX00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券