腾讯创建的AI代理商可以击败星际争霸2的Cheater AI

来自中国科技巨头腾讯的研究人员最近开发了一对AI代理能够在完全匹配的最高难度级别击败星际争霸II(SC2)“AI” ,使他们成为第一个这样做的人。

在最近发表的一份白皮书中,研究人员解释了这两种技术的开发,称为TSTARBOT1和TSTARBOT2。第一个是宏级控制器代理,它监视几个专门用于处理低级功能的算法。TSTARBOT2是两者中最强大的,它是一个宏观微控制器,由几个模块组成,可独立处理游戏的整个方面。

像所有基于神经网络的AI代理一样,TSARBOTS旨在模仿人类思维过程。

玩“星际争霸2”并不像玩“围棋”或“国际象棋”,所有的作品都放在桌子上并且看得很清楚。SC2玩家通常无法看到对方的单位,直到他们“侦察”地图,在腾讯的实验中,“战争迷雾”开启了。即便如此,玩家仍有大量的信息需要观察和处理。

人工智能代理人都受过训练,可以在深海礁上进行1V1 Zerg与Zerg的比赛,这张地图传统上阻碍了神经网络试图击败CPU。在短短几天内,两个代理商都可以在最困难的环境中击败计算机:10级。

很酷的部分:代理在单GPU上训练。不那么酷的部分:处理数十亿帧视频所需的大量数据需要大量处理器。据研究人员说:

我们目前采用1920个并行演员(80台机器上有3840个CPU)来生成重播过渡,速度约为每秒16,000帧。这显着缩短了训练时间(从数周到数天),并且由于探索轨迹的多样性增加,也提高了学习稳定性。

任务如此困难的原因之一是星际争霸2的三个最高难度设置是“AI”作弊。因为我无法击败它,它实际上叫做骗子AI。在最高级别,计算机知道所有资源在哪里,没有战争迷雾,并且总能看到地图上的每个单位。这是一个明显不公平的优势,旨在让对手克服难以置信的挑战。

TSTARBOT没有人类没有的任何优势 ,它必须在鼠标点击和宏方面与游戏接口,并且它“看到”一个人完全相同的东西。但是,由于算法没有眼睛,它们逐帧解释视频输出并将视觉信息转换为可以使用的数据。

要重新审视上面的国际象棋和围棋比较,还有一些事实是这些游戏是回合制的。在SC2中,所有玩家都会实时行动。再加上游戏中有数千个单位的事实,除了最有才华和技能最高的玩家,人类或其他人之外,它很快就变得难以管理。

感谢腾讯开发的高级指挥官范式,它根据中级和低级算法(或TSARBOT 2中的模块)跟踪整体策略,进行单元级管理,机器人更加人性化。

这意味着他们不仅能够击败最高难度级别,而且还能统治它。Bot number 2胜过90%以上,而排名第一的胜率不是71%。也许更有趣的是,他们都表现出击败铂金和钻石级人类的能力,但是人类赢得了比他们输掉更多的比赛。

而且,如果你想知道当TSTARBOT1和TSTARBOT2正面交锋时会发生什么,你可能会感到惊讶。Bot一次每次踢Bot两个屁股。尽管TSTARBOT2可能更适合与人类竞争(或者,可能进一步发展),并以更高的胜率击败内置的SC2 AI,但它无法抵御1的攻击策略。

据研究人员说:

值得注意的是,虽然TStarBot1可以成功学习并获得战胜所有内置AI和TStarBot2的策略,但它缺乏战略多样性以不断击败人类玩家。在上述与人类玩家的测试中,一旦人类玩家开始了解TStarBot1对Zergling Rush的偏好,TStarBot1将无法获胜。

如果您想深入了解机器人的工作方式,可以在此处查看白皮书 这是一个非常有趣的文章。别忘了查看我们的人工智能部分!

  • 发表于:
  • 原文链接https://thenextweb.com/artificial-intelligence/2018/09/20/tencent-created-ai-agents-that-can-beat-starcraft-2s-cheater-ai
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券