学习
实践
活动
专区
工具
TVP
写文章

AI挑战游戏《星际争霸》

如今,他再次跟《星际争霸》打起了交道。但这一次他不是玩家,而是要教机器人怎么玩这个游戏,也就是说,在人工智能成为全球最优秀的围棋选手后,星际成为了它下一个要攻克目标。

DeepMind与《星际争霸》的开发商暴雪展开合作,让人工智能研究人员从以往数百万次对战中进行学习。他们的目标之一,就是开发一套可以击败人类的人工智能系统,就像曾打败了围棋世界冠军李世乭和柯洁的AlphaGo。而最终的目标是将这一技术应用于现实世界,而不仅仅停留在游戏层面。

暴雪首席软件工程师Jacob Repp表示:“我们正试图理解人类大脑的工作方式。 如果我们能得到这种高质量的数据流-——人类玩儿游戏时的原始输入及其结果 ——这对行为研究的人来说是非常有用的数据。”

《星际争霸2》对人工智能研究人员来说是个有趣的挑战。与国际象棋或围棋不同,星际玩家的信息并不完美。这种“战争迷雾”意味着玩家(真实的或虚拟的)必须制定计划,做出决定,或者对那些只会在几分钟后才能产生后果的行为作出回应。正如DeepMind的研究人员所说,其结果“在时间信用分配和探索上将面临大量挑战”。

暴雪已经使用神经网络来评估玩家技能,而其依据是他们键盘和鼠标的输入信息、排兵布阵的方法以及玩游戏的效率等,这些信号可以让游戏更加有趣,或者让对战双方更加均衡。

但是,想要让人工智能玩《星际争霸2》,就必须让他们“看到”游戏中的3D地图,并快速准确地对其进行解读。

DeepMind的首次测试,涉及到神经网络和人工智能的训练,之后再将其应用投入到游戏中。即便没有进一步的指令,人工智能也可以随意在地图上走动、移动镜头甚至排兵布阵。

在加入DeepMind之前,Vinyals曾开发图片搜索功能和Gmail的“智能回复”功能。该团队还致力于语音识别,让人工智能记住不同人的说话方式,从而完成在再次遇到该声音时,可以完成识别。

“在《星际争霸2》中,这也是需要解决的问题。”Vinyals说。对人工智能来说,记住他们遇到的东西,同时理解行为意义,就需要使用LSTM神经网络。“电脑可以把某个数据的记忆保留数十年的时间,但现在,这种记忆不仅需要保存,在未来需要之时还能完成信息调取。”

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180316A0ZI8V00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券