前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2017年的人工智能承包了我们所有的游戏!

2017年的人工智能承包了我们所有的游戏!

作者头像
企鹅号小编
发布2018-01-23 20:46:49
6340
发布2018-01-23 20:46:49
举报
文章被收录于专栏:人工智能人工智能

在20世纪的大部分时间里,国际象棋博弈都是人工智能研究人员的基准。约翰·麦卡锡(John McCarthy)在20世纪50年代早期创造了“人工智能”一词,曾经把国际象棋称为“人工智能界的果蝇”,可见国际象棋对于人工智能研究的重要性。

在20世纪90年代后期,IBM的Deep Blue展开与世界冠军Garry Kasparov的一系列国际象棋比赛。于1997年最终击败卡斯帕罗夫,这标志着一台机器首次在比赛中击败了世界冠军。到了二十一世纪初,这项技术已经提高到无论在什么样的游戏环境中机器都能够击败国际象棋大师。

自然AI开发人员开始转向其他更复杂的游戏来测试他们日益复杂的算法。在过去的12个月里,AI越过了一系列新的门槛,最终在各种不同的游戏中击败人类玩家,从围棋游戏到动态交互式纸牌游戏,德州扑克。

Going going gone

在九十年代后期,在一台机器终于击败一个国际象棋特级大师之后,普林斯顿的一位天体物理学家评论道,“也许在一百年前一台计算机就可以击败人类,甚至可能在更久远的时间。”

面对挑战,计算机科学家把注意力转移到这个围棋游戏上,这个游戏看起来简单易玩,但却非常复杂。

在过去的十年里,机器学习的发展才刚刚创造出真正有竞争力的围棋选手。 2014年,Google开始研究一个名为AlphaGo的深度学习神经网络。经过几年的半成功的挑战之后,开发团队尝试了一些不同的东西。

在2016年底,流行的亚洲游戏服务器Tygem上出现了一个名为“Master”的神秘在线玩家。在接下来的几天里,这个神秘的玩家在这个系统上与许多世界冠军的游戏中都占主导地位。到1月4日,官方确认“Master”实际上是DeepMind的AI AlphaGo的最新版本。

2017年5月,AlphaGo“Master”赢过了世界排名最高的选手柯洁。在它们的三场比赛中,该机器全面占据了主导,但最令人吃惊的是,在十月份的时候,Google已经产生了比“Master”还要好的AlphaGo更复杂的迭代。

在《自然》期刊上发表的“AlphaGo Zero”是一个革命性的算法,目标是进行完全的自主学习。这个系统只是反复地对抗自己,并且学习如何掌握它所编程的任何游戏。经过21天的学习,AlphaGo Zero达到了“Master”的水平,到了第40天,它已经超过了之前版本的技能水平。

到2017年12月,DeepMind发现了一个更新的系统版本。这个名叫AlphaZero的新AI可以在几个小时内就掌握各种游戏。经过八个小时的自主训练,该系统不仅可以击败AlphaGo Zero之前的版本,还可以成为国际象棋特级大师和棋将冠军。

掌握虚张声势

虽然Go提供了一个复杂的游戏,但掌握扑克已经证明了AI的完全不同的命题。为了赢得大牌,需要掌握一点“欺骗”的艺术。当你被诈唬时,唬骗和识别是在这个纸牌游戏中需要掌握的关键的动态能力。

经过十多年的尝试,人工智能终于击败了大牌扑克专业人士。来自Alberta大学的DeepStack公布了一个人工智能系统,该系统可以用人工智能的“直觉”形式全面主宰人类的扑克玩家。

经过艰苦的20天的马拉松,机器全面击败所有四名职业扑克玩家。而卡内基梅隆大学的一个团队在2017年1月举行了更为公开的比赛,当时Libratus AI系统花费了20天时间与4名扑克专业人士共同玩了12万无限德州扑克。虽然职业玩家每天晚上都在讨论他们可以利用的人工智能的弱点,但是机器每天都在不断提高自身的能力,修补游戏中的漏洞并改进策略。

人类大脑赶不上机器的速度,经过近一个月的全天候游戏,Libratus还增加了170万美元,四名专业人员中的每一个人都失去了数千美元的虚构美元。其中一个失败的职业球员表示,“在比赛的中途连线的时候,我觉得自己就是在和一个在作弊的人打比赛,它就像能看到我的牌一样,我不是要指责它作弊了,只是它的表现是在是太好了。”

伊隆·马斯克的AI实验

2015年,Elon Musk和一小部分投资者成立了一个名为OpenAI的组织。该项目旨在探索人工智能系统的发展,特别关注强化学习——一个机器教自己如何改进特定任务的系统。

2017年8月,OpenAI团队着眼于征服Dota 2,这是一个名为“国际”的大型电竞赛的核心游戏。 Dota 2是一个非常流行、复杂的多人在线战斗竞技场游戏。

经过短短两周的学习,OpenAI机器人被放置在各种比赛中,随后它就击败了几名世界顶级选手。人工智能系统只是在一个更简单的一对一版本的游戏上进行训练,但是现在,OpenAI团队正在教导系统如何玩五对五的“团队”游戏。

几年前,Google DeepMind在49个Atari 2600游戏中设置了自己的AI。提供了与其他人类玩家相同的投入,AI想出了许多赢得游戏的方法。虽然有些游戏比其他游戏更难以掌握,尤其是80年代的经典电子游戏“Ms Pac-Man”尤其困难。

2017年,一家名为Maluuba的深度学习公司被Google收购,并被纳入DeepMind集团。 Maluuba的新机器学习方法被称为“混合奖励架构”(HRA)。将这种方法应用到Ms Pac-Man身上,该系统创建了150多名个体代理,每个代理都负责具体的目标,例如寻找特定的药丸或避开鬼魂。

HRA方法产生了一个顶级代理,类似于高级经理。这位最优秀的经纪人在做出个人行动的最终决定之前,评估下级代理人的所有建议。这个方法被委婉地称为“分而治之”,这样,一个复杂的任务就被分解成更小的部分。

AI将这一方法应用到Ms Pac-Man之后,AI很快就想出了如何取得999,990的高分,这是人类以前没有想到的。

人工智能很快就会在游戏中称霸

如果人工智能在几乎每一场比赛中都能击败我们,那么下一步是什么呢?

Falmouth大学的一位研究人员最近透露了一个机器学习算法,他声称这种人工智能可以为我们设计出自己的游戏。这个被称为安吉丽娜(Angelina)的人工智能系统每天都在不断改进,但是现在可以利用从维基共享网站(Wikimedia Commons)、在线报纸和社交媒体等来源的数据进行游戏。

那么,这意味着什么?

也许2017年最重要,最可怕的发展是强化学习系统的巨大进步。这些程序可以有效地教导自己如何掌握新的技能。例如,最近的AlphaZero迭代可以在几天的自主学习之后在某些游戏中实现超人的技能。

对350多名人工智能研究人员进行的一项大型调查显示,人工智能几乎可以把“所有的东西”都打败,这时间不会太长了。调查预测,到2049年,它将能够写出一本畅销小说,到2053年,它在手术上的表现会比人类更好。事实上,调查得出的结论是,到2060年AI有50%的可能性能够做人类做的每一件事,甚至比我们做的更好。

毫无疑问,2017年是人工智能在日益复杂的游戏中击败人类的一个里程碑,尽管这看起来微不足道,但其影响却是巨大的。这些发展中国家的许多公司正迅速将目光投向现实世界的挑战。谷歌DeepMind已经将AlphaGo Zero系统从游戏中移开,开始对蛋白质折叠进行了全面的研究,希望能对阿尔茨海默症和帕金森氏症等疾病进行治疗。

DeepMind联合创始人兼首席执行官戴米斯•哈萨比斯表示,“最终,我们希望利用这样的算法突破,帮助解决各种紧迫的现实世界问题。如果类似的技术可以应用到其他结构问题上,比如蛋白质折叠、减少能源消耗或者寻找革命性的新材料,那么这些突破性的进展就有可能促进人类的理解,并对我们的生活产生积极的影响。”

本文来自企鹅号 - 全球大搜罗媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - 全球大搜罗媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档