前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >DOTA 2血虐人类的OpenAI,原来靠的是作弊?

DOTA 2血虐人类的OpenAI,原来靠的是作弊?

作者头像
量子位
发布2018-09-29 10:16:19
8790
发布2018-09-29 10:16:19
举报
文章被收录于专栏:量子位
郭一璞 捣塔栗 发自 凹非寺 量子位 报道 | 公众号 QbitAI

两周前,AI战队OpenAI Five还处在DOTA2击败人类的得意中;

两周后,它就陷入了作弊疑云。

美国媒体Motherboard指出了OpenAI Five在这场人机大战中的几个可疑之处。

没有BP

头一项就是BP的问题。

不管是DOTA、LOL还是王者荣耀,MOBA游戏的玩家都知道,BP(ban pick)机制是保证游戏公平的重要一环,其中也体现了玩家双方团队斗智斗勇的过程。

BP发生在游戏开始前的选英雄过程,双方轮流禁掉部分英雄,然后再轮流选择英雄。

禁掉哪位强势英雄或者对方玩家擅长的英雄,选择怎样的英雄阵容,依据对方的阵容如何进行克制,是BP中玩家需要考虑的问题。

这个过程不禁考验双方对不同英雄的了解和熟练程度,更是一个耍心机的战场,BP是双方团队默契配合与策略博弈的一部分,也是MOBA游戏的重要组成部分。

DOTA2中文官网的英雄目录

目前DOTA2中有115位英雄,然而,在8月6日早上(北京时间)的人机大战中,由于OpenAI Five还没有学会这么多英雄,所以整场比赛只有18个英雄可供选择。

这么少的英雄数量若是还要ban英雄的话,那恐怕是没得选了。所以双方都只是象征性的走流程,ban掉了一些不在这18个英雄范围内的英雄,就开始选英雄了。

BP的策略关被AI省掉了,相当于给AI降低了难度。

我用眼睛,你却用API

在AI打游戏这件事上,交互方式是最让人关注的问题之一。

对于人脑而言,打游戏时的输入是视觉&听觉信号,人类玩家需要用眼睛和耳朵这两种“传感器”来接受信号,传送到大脑中,判断游戏中的情景,知道敌人离我有多远、队友能否来得及支援、双方经济状况如何。

而对AI而言却容易多了,在这场比赛中,OpenAI Five可不长眼睛,而是直接靠API读取游戏中的数据。

这一点,在推特上引起了热烈的讨论。

有许多观众觉得,人类和AI打的根本不是一个比赛。

佐治亚理工学院 (Georgia Tech) 教授Mark Riedl说,虽然那个API的设计初衷,就是不让AI拥有的信息多过人类能获取的信息,但AI只有依靠视觉,才是和人类站在同一片战场

不过,使用因为使用API而拥有优势,算不算作弊,依然有争论,毕竟这是官方赛前发布的消息。

但它确实不公平,因为这些数据带给AI的是100%的精确性。

比如说,当人类需要确认攻击能否打到敌人身上时,基本靠目测,如果低估了距离就会打不到敌人,如果高估了距离则容易受到敌人的攻击。而接收API数据的AI则可以通过计算卡在最远的距离上攻击敌人,或是在最佳的站位上发起进攻,足以保证自己的损失最小。

Capitalist

这次人机大战中的人类队员、DOTA2解说、半职业选手Capitalist(Austin Walsh)就对此感到十分扎心:

“AI清楚地知道每个英雄的位置,知道你拥有多少攻击力,它确切地知道一条路上的三、四个英雄可以造成多大的伤害。并且,当你的走位出现问题时,它会立即开团。我从来没这么玩过,这简直鹅妹子嘤。”

反之,让AI用视觉打游戏,并不简单。DeepMind用AI打星际的主力Oriol Vinyal,就让AI用视觉打过星际。用着64x64的输入,AI吃了大亏。

视频内容

大概,在依靠视觉这一目标达成之前,不管AI解锁多少英雄、多少物品,赢过多少顶级人类选手,也不能算是称霸DOTA 2。

我用鼠标,你却用意念

输出也同样不公平。

人类要输出操作信息,必须使用鼠标和键盘,控制技能施放、控制走位全都依赖于键鼠。而AI则连手指都不需要动,一个指令就直接操作了,使用“意念”控制,简直比人类用宏编程鼠标玩游戏还简单。

宏编程鼠标,就是上面这玩意,通常我们都叫它游戏鼠标,除了左键右键滚轮之外,还在中间、侧面等位置加装了许多按键,可以用宏来把这些新增的按键设计成不同的游戏按钮,一键完成许多复杂的操作,让玩家操作起来更简单。

不过,在正式DOTA2比赛中,使用宏编程鼠标是违规的。今年6月,秘鲁队就因为一名队员在资格赛中使用了宏编程鼠标而被取消了TI8的比赛资格,秘鲁队不得不和2479万美元的奖金池say goodbye了。所以,OpenAI Five这种使用“意念”的操作模式也可以算作弊。

更何况,在队友配合方面,AI用的也是“意念”。

人类队伍有5个人,需要用语言交流配合;而OpenAI Five的“团队”活在同一块U盘里,它们之间压根不用沟通,直接“心灵感应”就可以了,简直不要太轻松。

说好的200毫秒呢?

另外,赛前OpenAI团队表示,在人机对战中会把AI的反应时间,下调到与人类相似的200毫秒,以求公平竞争。

可在赛后,由于AI赢得过于轻松,反应速度受到了观众的强烈质疑。

“肯定比200毫秒快”,这样的声音此起彼伏。

“这是扯淡!”

如果说,API是一早就公布了的信息,算不得作弊,那反应速度若有虚报,就是另一回事了。

然而,这个怀疑并没有得到OpenAI的官方回应。

不公平 = 作弊?

这场比赛是存在不公平的因素,但若强硬地表述为AI作弊,在许多人看来仍然有失偏颇。

比如,提出“AI该靠视觉来跟人类同场竞技”的Mark Riedl教授本人,就很排斥这个说法。

他觉得,OpenAI并没有隐藏AI的任何优势。尽人皆知的事,很难用“作弊”来定义。

另外,Riedl在深知这些的情况下,依然认为在DOTA2 5v5团战中战胜人类,是非常了不起的成就。

他看到,AI游刃有余,只要对手所处的位置不利,便可瞬间发动攻击。于是,获得了和现场观众一样的美妙感受。

毕竟,神经网络与人脑之间依然存在很大的差别,对人类来说自然而然的事,机器也要一点一点学起来。

这样想来,虽然比赛是在严格控制的环境下进行的,AI也算赢得漂亮。

TI8敬请期待

无论作弊的定义是否准确,人类都已经从被AI摩擦的恐惧里,感受到了OpenAI Five的强大。

所以,大家还是希望看到一场更加公平的比赛,不论是为人类正名也好,反向衬托AI的实力也罢。

如果,上一场5v5没有让各位心服口服,OpenAI Five不日将出战TI8。希望那时,顶级人类选手和AI之间的比赛,大家能看个过瘾。

你猜,和AI打比赛的会是哪支队?

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-08-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 没有BP
  • 我用眼睛,你却用API
  • 我用鼠标,你却用意念
  • 说好的200毫秒呢?
  • 不公平 = 作弊?
  • TI8敬请期待
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档