OpenAI five杠上DOTA玩家,究竟谁能雄霸天下?

OpenAI背景:由多位硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。

人工智能的智能有多种方面,OpenAI团队选择使用DOTA作为通用AI系统的测试平台,通过游戏来捕捉混乱而又连续的世界本质,比如团队合作、长远的视野和隐藏的信息。

电子竞技本就是一个复杂的领域,与下围棋下象棋的最大不同,就是这并不是场个人秀,与队友间的合作很重要。

换句话说,用这款游戏来测试,AI的协作意图很明显。

2017年8月11日,击败人类顶级职业玩家Dendi。

这场阵容,双方中线影魔solo,顺便提一句,影魔solo是个很取巧的选择,把游戏里的变量减少到了极致。

从AI对Dendi的表现上来看,它取胜的关键也无非是精准的影压,取消技能,和卡兵,换句话说,就是操作。

鉴于1v1主要比拼机械技能,AI击败人类玩家并不奇怪。

对战中几乎没有必要进行长期规划或协调,也体现不了协作的意图,这次比赛宣传意义大于科研价值。

更值得一提的是,与Dendi比赛结束后,AI被现场水友掉打,这个结果估计是他们团队没有预料到的。

2018年1月,OpenAI团队第一次宣布5V5训练结果,与他们编写的脚本机器人对战胜利。

2018年4月,OpenAI团队在官网宣布:AI机器人在DOTA2中击败了人类,这是一件大事,因为他们的胜利需要团队合作,这是推动人工智能发展的一个巨大里程碑。

2018年6月,这次AI对战OpenAI员工,也是AI首次与人类进行团战。

2018年8月,OpenAI在可以容纳数千人的直播间进行直播比赛。

第一局与观众志愿队伍进行公开比赛,结果仅用14分钟就获得胜利(实力相当的匹配一局下来平均用时45分钟)。

第二局在24分53秒内赢得了比赛。

第三局比赛,观众为AI选择了弱势英雄,最终AI在35分47秒后输掉了第三局。

两周后,OpenAI征战TI8,不过这一次AI并不顺利。

首场对战南美赛区的队伍PG,这支队伍是本次 TI 18支队伍中首个被淘汰的队伍。比赛采用BO1的模式,一局定胜负。这是AI首次在DOTA2最高级的比赛上以5V5的形式对阵人类职业选手。

第二场对战给了中国玩家一个惊喜,AI对战来自中国的五位前职业玩家,他们都是中国DOTA圈元老级人物。在比赛前,OpenAI Five的工程领队Greg Brockman在赛前表示,遵守三局两胜的战局。

不过这次很遗憾,AI两都次败给人类玩家。

OpenAI团队对这次的比赛进行了一次总结,下面为团队博文翻译。

OpenAI Five 在DOTA 2 全球顶级赛事 TI8(The International DOTA2 Championships)中与人类职业玩家打了两场,输了两场。其实在比赛过程中,人工智能在前期,特别是在前20~35分钟,一直占据着上风。

这次比赛与17天前的Benchmark赛相比,有以下特点:

这次的对手更加强大

英雄阵容由第三方提供

比赛规则的一些限制对AI不利

因为OpenAI Five的五名AI“队员”是从零开始训练的,所以这场专业比赛中,AI的表现仍然令人兴奋。与人类顶级选手对决,如果赢得了比赛当然是非常好,如果比赛输了也会给我们带来非常宝贵的经验,帮助OpenAI Five更上一层楼。

规则变化

这次比赛的目的是想看看OpenAI Five 的能力与世界顶级玩家的差距在哪里,与之前的比赛相比,这次的比赛更加正式也更加真实。在比赛之前,我们并不知道将会与谁交手,因为这取决于有谁愿意与我们比赛。

很高兴有如此强大的队伍与我们比赛,相对于之前的Benchmark,我们这两天获得了更多的宝贵经验。

OpenAIFive的第一场比赛是昨天与paiN的对决,虽然这支战队在角逐冠军的时候被淘汰了,但是做为Dota2 18支顶级战队中的一支,仍然有着强大的实力。并且,这支队伍在职业锦标赛中平均赢得了350000美元。

第一场比赛持续了51分钟,这个时间有些略长,因为一局游戏平均下来只有45分钟。在游戏的中期OpenAI Five重新获得了一些优势,但是最终还是输给了人类玩家的策略搭配。

第二场比赛的对手是中国名人堂的选手,他们每一位都身经百战,这场比赛持续了45分钟,和上一局一样,在中前期OpenAI Five占据着上风,但是在一系列激烈团战后,OpenAI Five由优势转为劣势,然后输掉了比赛。

在之前的Benchmark比赛中,我们配备了一项重要的限制条件:允许每个英雄一个自身的安全信使(一个向你的英雄传递道具的单位),而不是一个团队的可被破坏的信使。而我们在这两日的比赛中解除了这项限制。

信使可以不断运送英雄的恢复品,使得OpenAI更容易保持英雄的状态,频繁的参与到对敌方的进攻中。在一场Dota比赛中,状态较差的英雄可能会放弃进攻,选择回家补充状态。很多观众认为,附加的信使会让游戏看起来不像“真正的Dota”。

我们在六天之前展开训练(信使和其他项目一样,是代码中的一项)。当我们认为单一信使会暂时降低Five的表现时,Dota社区则认为单一信使会让比赛更加激动人心。

接下来的目标

我们不认为信使的变化是失败的原因。我们认为,我们还需更多的训练,进行漏洞修复,以及将模型中最后一块照本宣科的部分移除。我们期待着将OpenAI Five推向下一个等级。

这两日的对战重新让我们认识到了Dota人机对战中的差异,也给了我们更多的想象空间。但是OpenAI Five的设计并不只是针对Dota 2这样一个游戏,它更多的技术探讨是如何将AI技术建立在一个安全的沙盒中,而这个沙盒会帮助我们在未来建立先进性的系统。

原文链接:

https://blog.openai.com/the-international-2018-results/

这一次AI征战DOTA以失败告终,其实是可以预见的,真正的人工智能还有很长路要走,乐观点说失败也是进步的一种表现形式。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180829A1EZ2B00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券