新智元报道
作者:新智元编辑部
OpenAI 力挺45分钟,还是输了!
昨天第一场比赛输了之后,在今天Ti8表演赛中,OpenAI Five战队再次与人类交锋。
这次赢家是来自中国的五位前职业选手,历经45分钟鏖战后,最终战胜OpenAI Five。
这五位选手分别是:
张宁(xiao8),《DOTA》、《DOTA2》职业选手,游戏 ID:xiao8、曾效力于 NEWBEE 战队,2014 年加入 LGD 战队,担任 LGD 战队队长。
骆非池(430),Dota/Dota2 职业选手,曾效力于 IG 电子竞技俱乐部,担任 2 号位,由于其使用的卡尔曾处于世界巅峰,人送外号 “钢琴手”。
王兆辉(sansheng),DotA 职业选手,TI4 世界冠军成员。ID:sansheng,位置:五号位 support,曾效力于 tongfu(同福)等战队,江湖人称狗哥。
徐志雷(burning),世界著名carry选手,被认为是世界上最优秀的、最有经验的carry选手之一,多年来获得多次carry奖项和世界冠军。
白帆(rotk),担任3号位,且担任BP一职。擅长蝙蝠骑士,黑暗贤者,潮汐猎人。他曾带领TYLOO战队获得DMT冠军,2011年DK战队.9冠王成员。
(图据Dota Cinema推特)
比赛双方阵容与昨天相比,只是做了简单的互换,即:
OpenAI团队根据昨天表演赛的结果,表示他们做进一步的修改与调试。
因此在今天比赛前期与中期,可以看到AI玩家的失误并没有昨天那么多;但是到了后期,OpenAI Five战队却频频出bug,活似几只无头苍蝇,最终导致比赛的失败。
从整体的表现来看,OpenAI在反应速度、计算精准度、操作等方面依旧体现出与人类相当甚至超越人类的优势。而在团队策略、灵活性、应对突发情况等方面,仍有待提高。
以下是这场比赛的赛事回顾。
人类绝地反击,几波GANK打败出Bug的OpenAI
比赛一开场,人类玩家紧紧抱团,OpenAI毫无悬念的献出了一血,然而,AI也不示弱,立即做出反击,最终双方以“2换2”结束了开场。
前期发育过程当中,AI更注重团战,而人类玩家更侧重各自的发育,导致人类玩家在前期人头数量上较为落后。
虽然今天AI插眼的情况比起昨天来讲有些进步(起码没有过多的胡乱插眼),但还是出现了“假眼插真眼旁边”、“家里安个摄像头”等现象:
第一波精彩GANK,人类玩家在中路欲强推塔,却被AI一手反击,导致节节倒退,还让OpenAI团队顺利完成双杀。而后,AI队伍一鼓作气,顺利拿下中路一塔。这一波给了矮人直升机很好的发育机会,直接“大杀特杀”!
第二波精彩GANK,潮汐大住四个人,人类玩家漂亮的一记回马枪,遏制住了AI前进的步伐,将局势hold住,OpenAI这波血亏!(注意!OpenAI 竟然学会打字了!)
第三波精彩GANK, 这一次,人类玩家终于安耐不住了,准备绝地反击!
人类玩家先手,放大控到了三个人,但由于AI反应着实有点快,此次反击战没有拿到特别大的优势。
第四波精彩GANK,AI战队各自游走,人类战队开始团战,游击战术剿灭OpenAI四名成员,近乎团灭。而此时,AI的策略是让斧王单带,下路带线推塔,然而效果却不是很理想。
后期,OpenAI貌似出现bug,频频在家里插眼,各自行动,团队之间毫无配合可言,活似无头苍蝇。OpenAI显然面对逆风局势时无法做出策略进行应对,这再次证明AI在战略制定上是远不及人类的。
最终,人类玩家一鼓作气,夺得此次比赛的胜利!
赛前,OpenAI Dota团队负责人Greg Brockman表示,根据三打两胜的规则,如果这次AI输掉,那就是他们最后的一次比赛了。
所以,中国选手阻止了AI攻破dota的道路。
AI曾推塔如割草,但在平均9000分的高手前面无力还手
此前的DOTA赛事中,Open AI的表现没这么差。
8月5日,5位Dota 2高手——排名超越了全世界99.5%的玩家,与OpenAI Five对战。
结果,人类被AI完虐了。
最终的比分是2:1,人类扳回一局才挽回颜面。
但挽回颜面的这一句也是由于主办方临时兴起——或许接连三次看着AI短时间把内碾压人类,对现场观众和看直播的10万+网友并没有那么有趣。
第三局,现场观众给AI指定了英雄——而且是不好的组合,AI在确定完英雄后便预测自己获胜的概率只有37%。
昨天,OpenAI Five首次亮相Dota 2 国际大型赛事的最佳赛事TI8,与之对战的世界上顶级最好役职业玩家(平均水平9000分),可惜AI落败。
在昨天的比赛开始不久,OpenAI Five一直选择杀人而不去推塔,中文斗鱼解说还调侃:照这样看,我也可以去打OpenAI,吹吹牛X。
神速进化的Open AI:代表了多智能体决策智能的国际最高水准
自从2016年的TI7上以1V1的形式战胜了世界顶级玩家Dendi,OpenAI的的Dota2攻略之战进步神速:证据就是上面的例子。
仅仅一年后,就能从1v1成功升级到5v5,国内首家决策智能公司启元世界的创始人兼CEO袁泉点评:
“Dota游戏是一个典型的AI难题,它综合了决策周期长,空间大而且敌我双方是在非完全信息下博弈。 OpenAI继去年解决1v1的问题后,1年内能在5v5的更复杂情况下,完全依靠自我对抗学习、无显式通讯信道的前提下,即展现出了类似于人的长期规划协作能力,代表了多智能体决策智能的国际最高水准,也体现了大规模算力带来的美感。”
OpenAI Five也不负众望,从天梯水平平均4000分的团队,到拿下平均7000分的人类玩家,也只用了几周的训练时间。
OpenAI Five拿下天梯平均7000分的人类玩家团队
如果AI今天获胜,那就将是一个巨大的胜利,是人工智能和游戏行业史上的重要里程碑。
赛前,TI8论坛还发起过投票,让网友预OpenAI的胜率,出乎意料的,大部分人还是选择了人类获胜——而根据OpenAI一路走来的表现,似乎在TI8上取胜,对AI来说轻而易举。
然后,情况完全反转——这一次是,是AI被人类团队横扫一空。
战胜OpenAI Five的职业团队pg
这一切都感觉有点突然。
AI有AI的玩法,训练一天相当于人类的180年
OpenAI Five现在还不能玩完整的Dota2,在8月5号战胜准职业玩家队伍时,OpenAI Five只能从115个英雄中选择18个玩。
但OpenAI Five仍然展现出精确的计算、激进的战斗风格和不可阻挡的动力。AI出招惊人,没有按照Dota 2的惯例,使用新的方法来操控英雄、分配资源并最终获胜。
AI与人类玩得如此不同的一个原因是,AI不是人类:AI可以进行远远超出顶级职业玩家的计算,实现超人的效率和精确度。但是,更加吸引人的是5个AI之间彼此的配合,OpenAI Five 没有使用规则进行编码,而是通过强化学习自己训练自己。
每一秒钟,OpenAI Five都会收到来自Dota 2 API的超过20000个观测值。这些数字描述了从英雄的血量到特定敌人的debuff消耗的秒数之间的所有数字。与此同时,5个AI可以选择数以千计的行动——插眼、移动、攻击、使用法术或物品,出现在地图上的各种目标或位置。
AI面临的挑战是弄清楚这20000个观测中的哪一个在眼下是重要的,据此采取哪些行动更有可能帮助自己获胜。
OpenAI Five提前预测行动
而这其中的关键,则是将所有这些输入和输出聚集在一起的神经网络。这几个神经网络最重要的一个作用,是对每个输入给予权重——增加或减少特定的输入对特定输出的影响。
在第一场比赛惜败于人类职业团队pg以后,OpenAI的研究人员表示这次输掉有3大原因,其中包括权重的设置。在接下来的对战中,他们将对此进行调整。
昨天比赛中OpenAI Five经济的情况
OpenAI Five从随机选择的权重开始,因此,这个时候从来没有玩过Dota2的人都有机会在这个阶段击败Five。但随着时间的推移,AI收到反馈——当获得金币或杀死敌方英雄时将获得奖励,而当自己的英雄死亡时受到惩罚——以及由此它们每次在自己的神经网络上稍微调整权重。很快,AI玩Dota2的能力将超越普通人,毕竟训练一天相当于人类的180年。
在昨天进行的TI8第一场比赛中,OpenAI Five在团队合作和相互支援方面表现较好,这一点从人头数量上可以体现,然后经济方面却表现得更糟糕,最初磕磕绊绊,然后完全崩溃。
OpenAI Five在对战之初对自己获胜的预测值一直很高,它们决心玩激进的游戏风格,直到最终输掉前,AI对自己获胜概率的预期仍然超过了70%。
这也使得AI的一系列行动似乎可以理解,我有更大的几率赢,我可以进行更多插眼,在地图上各个地方探索。规划长时间游戏需要对更长远的未来进行预测,并且能够分开10、20或30分钟进行活动。
事实证明,在30分钟内收集足够多的黄金,变得强大到赢得比赛,比放出技能杀掉英雄更难学习。
游戏AI的结束,也是一个新的开始
在第二场比赛中,OpenAI Five经过了一些调整,修复了一场比赛中展示出来的所谓的“BUG”……,
对于人工智能研究人员而言,胜利就是胜利,这将成为人工智能史上的另一个里程碑。
但另一方面,对于Dota2或整个电子竞技游戏行业来说,目前影响还不大——OpenAI的方法需要好几个月的训练时间,以及几百万美元的硬件,更不要说一批世界顶级的AI研究者。
对于OpenAI来说,在Dota 2中击败人类是在现实世界中实现通用AI漫长旅程的第一步。
那值得庆祝的地方在哪里?
OpenAI在Dota 2上变得更好,或者DeepMind突然开发出世界上最好的《星际争霸2》AI,对普通人来说有什么用?
首先,这将提醒我们,就像当年AlphaGo给围棋界带来的启发一样,人类每天玩的这些游戏仍然包含未知的维度。
OpenAI Five有着超人的反应,但英雄彼此之间的配合,以及第一分钟就派四个英雄来推塔的战术。AI将始终挑战我们的认识,让人类不断寻找新的策略,并为我们提供一个可以不断努力的目标。
OpenAI Five的胜利(或失败)并不代表游戏AI的结束,而是一个新的开始。