首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

AI可以在游戏里称霸,但是解决现实问题太难了

1997年,为了在国际象棋中击败象棋大师加里·卡斯帕罗夫(Garry Kasparov),IBM的工程师们在他们的“深蓝”(Deep Blue)电脑中使用了几个世纪的国际象棋智慧。2016年,通过研究成千上万的人类对战经验,谷歌旗下人工智能(AI)子公司DeepMind的AlphaGo击败了韩国围棋冠军李世石(Lee Sedol)。

2017年10月份,DeepMind团队公布了新的围棋系统--AlphaGo Zero的细节,该系统根本没有研究人类的下棋经验。相反,它直接从研究游戏规则开始,并与自己对抗。它的第一个动作完全是随机的,而在每场比赛之后,它都对帮助其取胜或导致其失败的新知识进行了总结。在这些混战结束后,AlphaGo Zero与曾经击败李世石的AlphaGo超人版本进行了正面交锋,并以100:0的战绩完败对手。

这个团队继续开发了AlphaGo家族的另一个游戏大师,并为其取名AlphaZero。去年12月份,DeepMind的研究人员在科学网站ArXiv.org上发表论文指出,经过从头开始的重新设计,AlphaZero的表现优于AlphaGo Zero。换句话说,它击败了曾击败过世界上最好围棋棋手的机器人。

当它获得国际象棋规则或日本将棋的规则时,AlphaZero也很快学会了击败这些游戏顶级算法的方式。专家们对该项目咄咄逼人、令人感到陌生的风格感到惊叹。丹麦大师彼得·海恩·尼尔森(Peter Heine Nielsen)在接受BBC采访时表示:“我一直在想,如果有更高级的物种降落在地球上,他们是如何下国际象棋的。现在我知道了。”

在过去的一年里,在各种各样的场景中出现了超凡脱世的自学机器人,如无极限扑克和 《Dota 2》。

DeepMind研究团队希望将类似的方法应用到现实世界中帮助解决实际问题,比如建造室温超导体,或者理解将蛋白质折叠成有效药物分子的方式。当然,许多实践者希望最终建立起通用人工智能,这是个定义尚不清楚但却有令人着迷的目标:机器可以像人类那样思考,并可以帮助解决许多不同类型的问题。

然而,尽管在这些系统中进行了大量投资,但目前的技术能走多远还不清楚。华盛顿大学计算机科学家佩德罗·多明戈斯(Pedro Domingos)说:“我不确定AlphaZero的想法是否能轻易地推广开来,毕竟游戏是极为特殊的东西。”

许多游戏、国际象棋和围棋都有一个特点,就是玩家可以随时看到两边的棋子。每个玩家都有关于游戏状态的“完美信息”。无论游戏有多么复杂,你所需要做的就是从当前的情况出发去思考。然而,很多真实情况并非如此。想象一下,让电脑诊断疾病或进行商务谈判。卡内基梅隆大学计算机科学专业博士生诺姆·布朗(Noam Brown)表示:“大多数现实世界的战略互动都涉及隐性信息,我觉得这被大多数AI社区忽视了。”

加州大学伯克利分校的博士生切尔西·芬恩(Chelsea Finn)说:“所有这些游戏,所有这些结果,都是在你可以完美模拟世界的环境中进行的。”芬恩曾使用AI控制机器人手臂,并从传感器中解读数据。其他领域并不那么容易被模仿。

例如,无人驾驶汽车在应对恶劣天气或骑单车时遇到了困难。或者,它们可能无法捕捉到现实世界中的多种不确定因素,比如恰好有鸟飞过挡住了汽车摄像头。芬恩说,对于机器人手臂来说,最初的模拟提供了基础物理学,让手臂至少学会了如何学习。但是,他们没有捕捉到接触表面的细节,这意味着像拧开瓶盖或进行复杂外科手术的任务也需要现实世界的经验。

很难确定AI何时能取得游戏霸主地位。你可以选择卡斯帕罗夫在国际象棋中的失利,或者李世石败给虚拟对手AlphaGo。另一个流行的选择是,2011年美国智力游戏《危险边缘》(Jeopardy)冠军肯·詹宁斯(Ken Jennings)输给了IBM电脑沃森(Watson)。沃森可以解析游戏的线索,处理文字游戏。两天的比赛还没有结束,詹宁斯就写道:“首先,我欢迎我们的新电脑霸主。”

沃森似乎被赋予了人类在许多现实问题上所使用的文书技能。它可以用英语提示,以闪电般的速度翻查相关文件,找到相关的信息片段,并找到一个最好的答案。但七年后,现实世界继续对AI提出了严峻的挑战。2017年9月份健康杂志《Stat》发布的报告显示,作为沃森肿瘤研究计划(Watson for Oncology)的目标,研究和设计个性化的癌症治疗方案非常困难。

当被要求从AI的角度来比较上述两种情况时,本吉奥写道:“ 《危险边缘》中的问题更容易理解,因为它们不需要太多的常识。而理解一篇医学文章要难得多。同样,需要进行很多基础研究。”

尽管游戏很特别,但仍然存在一些类似的现实问题。DeepMind的研究人员已经表示,他们的技术可能很快就能帮助生物医学研究者,后者想要更多了解蛋白质的折叠。

为了做到这一点,他们需要弄清楚组成蛋白质扭结的各种氨基酸是如何折叠成小三维机器的,其功能取决于它的形状。这在国际象棋中同样十分棘手,化学家们很清楚地知道规则,可以计算出特定的场景,但是仍然有很多可能的配置方案,想要了解所有可能性几乎是不可能的。

但是如果蛋白质折叠可以被配置成游戏呢?事实上,它已经存在了。自2008年以来,成千上万的人类玩家尝试过在线游戏《Foldit》,用户可以在其折叠的蛋白质结构的稳定性和可行性上得分。机器可以以类似的方式训练自己,也许通过尝试通用强化学习来击败它之前的最好成绩。

苏茨克维尔认为,强化学习和“自我启发”也有助于训练对话系统。这将使机器人能够通过自言自语的方式进行训练,并实现与人类对话。考虑到专业的AI硬件正变得越来越快、越来越普及,工程师们将会有动力以游戏的形式提出越来越多的问题。苏茨克维尔说:“我认为,将来自我启发和其他消耗大量计算能力的方式将变得越来越重要。”

但是,如果最终的目标是让机器尽可能多地完成任务,即使是自学成才、通才的棋盘游戏冠军,比如AlphaZero,也可能有办法实现。麻省理工学院认知科学家乔希·特南鲍姆(Josh Tenenbaum)说:“至少在我看来,你必须看到,真正的思维活动、创造性的思想探索以及我们目前在AI领域所看到的东西之间存在着巨大的鸿沟。这种智能是存在的,但它主要发生在伟大的AI研究人员的头脑中。”

谷歌深度学习研究员弗朗索瓦·乔莱(Francois Chollet)说:“我要保持小心,不要过高估计玩这些游戏的重要性,不管是AI还是普通工作。人类不是很擅长游戏,但要记住,非常简单的专业工具实际上可以实现很多目标。”

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180324B1ARXG00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券