DOTA 2血虐人类的OpenAI，原来靠的是作弊？

量子位

发布于 2018-09-29 10:16:19

8880

发布于 2018-09-29 10:16:19

文章被收录于专栏：量子位

郭一璞捣塔栗发自凹非寺量子位报道 | 公众号 QbitAI

两周前，AI战队OpenAI Five还处在DOTA2击败人类的得意中；

两周后，它就陷入了作弊疑云。

美国媒体Motherboard指出了OpenAI Five在这场人机大战中的几个可疑之处。

没有BP

头一项就是BP的问题。

不管是DOTA、LOL还是王者荣耀，MOBA游戏的玩家都知道，BP（ban pick）机制是保证游戏公平的重要一环，其中也体现了玩家双方团队斗智斗勇的过程。

BP发生在游戏开始前的选英雄过程，双方轮流禁掉部分英雄，然后再轮流选择英雄。

禁掉哪位强势英雄或者对方玩家擅长的英雄，选择怎样的英雄阵容，依据对方的阵容如何进行克制，是BP中玩家需要考虑的问题。

这个过程不禁考验双方对不同英雄的了解和熟练程度，更是一个耍心机的战场，BP是双方团队默契配合与策略博弈的一部分，也是MOBA游戏的重要组成部分。

△ DOTA2中文官网的英雄目录

目前DOTA2中有115位英雄，然而，在8月6日早上（北京时间）的人机大战中，由于OpenAI Five还没有学会这么多英雄，所以整场比赛只有18个英雄可供选择。

这么少的英雄数量若是还要ban英雄的话，那恐怕是没得选了。所以双方都只是象征性的走流程，ban掉了一些不在这18个英雄范围内的英雄，就开始选英雄了。

BP的策略关被AI省掉了，相当于给AI降低了难度。

我用眼睛，你却用API

在AI打游戏这件事上，交互方式是最让人关注的问题之一。

对于人脑而言，打游戏时的输入是视觉&听觉信号，人类玩家需要用眼睛和耳朵这两种“传感器”来接受信号，传送到大脑中，判断游戏中的情景，知道敌人离我有多远、队友能否来得及支援、双方经济状况如何。

而对AI而言却容易多了，在这场比赛中，OpenAI Five可不长眼睛，而是直接靠API读取游戏中的数据。

这一点，在推特上引起了热烈的讨论。

有许多观众觉得，人类和AI打的根本不是一个比赛。

佐治亚理工学院 (Georgia Tech) 教授Mark Riedl说，虽然那个API的设计初衷，就是不让AI拥有的信息多过人类能获取的信息，但AI只有依靠视觉，才是和人类站在同一片战场。

不过，使用因为使用API而拥有优势，算不算作弊，依然有争论，毕竟这是官方赛前发布的消息。

但它确实不公平，因为这些数据带给AI的是100%的精确性。

比如说，当人类需要确认攻击能否打到敌人身上时，基本靠目测，如果低估了距离就会打不到敌人，如果高估了距离则容易受到敌人的攻击。而接收API数据的AI则可以通过计算卡在最远的距离上攻击敌人，或是在最佳的站位上发起进攻，足以保证自己的损失最小。

△ Capitalist

这次人机大战中的人类队员、DOTA2解说、半职业选手Capitalist（Austin Walsh）就对此感到十分扎心：

“AI清楚地知道每个英雄的位置，知道你拥有多少攻击力，它确切地知道一条路上的三、四个英雄可以造成多大的伤害。并且，当你的走位出现问题时，它会立即开团。我从来没这么玩过，这简直鹅妹子嘤。”

反之，让AI用视觉打游戏，并不简单。DeepMind用AI打星际的主力Oriol Vinyal，就让AI用视觉打过星际。用着64x64的输入，AI吃了大亏。

视频内容

大概，在依靠视觉这一目标达成之前，不管AI解锁多少英雄、多少物品，赢过多少顶级人类选手，也不能算是称霸DOTA 2。

我用鼠标，你却用意念

输出也同样不公平。

人类要输出操作信息，必须使用鼠标和键盘，控制技能施放、控制走位全都依赖于键鼠。而AI则连手指都不需要动，一个指令就直接操作了，使用“意念”控制，简直比人类用宏编程鼠标玩游戏还简单。

宏编程鼠标，就是上面这玩意，通常我们都叫它游戏鼠标，除了左键右键滚轮之外，还在中间、侧面等位置加装了许多按键，可以用宏来把这些新增的按键设计成不同的游戏按钮，一键完成许多复杂的操作，让玩家操作起来更简单。

不过，在正式DOTA2比赛中，使用宏编程鼠标是违规的。今年6月，秘鲁队就因为一名队员在资格赛中使用了宏编程鼠标而被取消了TI8的比赛资格，秘鲁队不得不和2479万美元的奖金池say goodbye了。所以，OpenAI Five这种使用“意念”的操作模式也可以算作弊。

更何况，在队友配合方面，AI用的也是“意念”。

人类队伍有5个人，需要用语言交流配合；而OpenAI Five的“团队”活在同一块U盘里，它们之间压根不用沟通，直接“心灵感应”就可以了，简直不要太轻松。

说好的200毫秒呢？

另外，赛前OpenAI团队表示，在人机对战中会把AI的反应时间，下调到与人类相似的200毫秒，以求公平竞争。

可在赛后，由于AI赢得过于轻松，反应速度受到了观众的强烈质疑。

“肯定比200毫秒快”，这样的声音此起彼伏。

△ “这是扯淡！”

如果说，API是一早就公布了的信息，算不得作弊，那反应速度若有虚报，就是另一回事了。

然而，这个怀疑并没有得到OpenAI的官方回应。

不公平 = 作弊？

这场比赛是存在不公平的因素，但若强硬地表述为AI作弊，在许多人看来仍然有失偏颇。

比如，提出“AI该靠视觉来跟人类同场竞技”的Mark Riedl教授本人，就很排斥这个说法。

他觉得，OpenAI并没有隐藏AI的任何优势。尽人皆知的事，很难用“作弊”来定义。

另外，Riedl在深知这些的情况下，依然认为在DOTA2 5v5团战中战胜人类，是非常了不起的成就。

他看到，AI游刃有余，只要对手所处的位置不利，便可瞬间发动攻击。于是，获得了和现场观众一样的美妙感受。

毕竟，神经网络与人脑之间依然存在很大的差别，对人类来说自然而然的事，机器也要一点一点学起来。

这样想来，虽然比赛是在严格控制的环境下进行的，AI也算赢得漂亮。

TI8敬请期待

无论作弊的定义是否准确，人类都已经从被AI摩擦的恐惧里，感受到了OpenAI Five的强大。

所以，大家还是希望看到一场更加公平的比赛，不论是为人类正名也好，反向衬托AI的实力也罢。

如果，上一场5v5没有让各位心服口服，OpenAI Five不日将出战TI8。希望那时，顶级人类选手和AI之间的比赛，大家能看个过瘾。

你猜，和AI打比赛的会是哪支队？

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2018-08-21，如有侵权请联系 cloudcommunity@tencent.com 删除

其他

本文分享自量子位微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

其他

登录后参与评论

0 条评论

热度