学习
实践
活动
专区
工具
TVP
写文章

“阿尔法星际”战胜人类玩家,人工智能边界不断扩大

1月25日凌晨,DeepMind与暴雪在网上直播,公布了在《星际争霸2》游戏中取得的进展,名为“AlphaStar”(阿尔法星际)的人工智能在与两位人类职业选手“TLO”和“MANA”的比赛中,均以5比0取胜。人工智能再次“碾压人类”。

由于《星际争霸2》是公认的策略极其复杂的游戏,DeepMind在这个游戏中取得的成绩被认为是有一个人工智能领域中里程碑式的事件。

“这又是一个非常有意思的进展,DeepMind确实很厉害,令人佩服。” 中国科学院计算技术研究所陈云霁研究员对第一财经记者表示。陈云霁爱打星际争霸,也密切关注DeepMind在人机大战方面的进展。他表示:“场景边界明确、规则明确的领域,机器迟早都能战胜人类。”

去年8月,DeepMind和游戏公司暴雪(Blizzard)宣布合作发布一项叫做SC2LE的工具,希望能够加速人工智能在实时策略游戏《星际争霸2》中的研究。DeepMind当时表示:“我们的目标是不断扩大人工智能的边界,开发能够解决复杂问题的系统。为了实现这一目标,DeepMind实验室设计了一系列的机器人特工,并测试他们在不同环境下的能力,让他们去玩一些人类玩了几十年的游戏。打败人类不是我们设计的最终目的,但这对于对标机器人的性能非常重要。”

此前DeepMind在围棋项目AlphaGo中战胜柯洁和李世石,一度引起人工智能界的轰动。DeepMind在克服了很多技术上的难题之后,“AlphaStar”正式诞生,并开始与人类职业选手的测试。

AlphaStar跟AlphaGo有些类似,最开始都是通过学习人类选手的Replay(比赛录像)来提升水平。直播中展示的10场比赛都是在一张相同的比赛地图上进行,并且人工智能的APM(每分钟操作的次数)限制在与人类选手相仿的程度。

人工智能医疗企业珠海医凯电子科技有限公司技术团队负责人张国峰对第一财经记者表示:“人工智能对付游戏确实非常有效,因为游戏是人类设计的有限规则环境,即便它再复杂也是有限的规则,永远没有‘意外’。在这种环境之下的对弈,人工智能的响应速度和判断参数要全面优于人类。因此AI在很长一段时间的未来,在可控的有限规则环境下,将全面取代人类,比如工厂生产等。”

然而,现实世界在大多数情况下都是无限的规则环境,比如安防或者无人驾驶。以无人驾驶为例,目前大多数的无人驾驶都仍然处于全封闭的道路测试阶段,而如果放开至开放道路,则将面临更多的不确定因素。

张国峰认为,即便是在无限规则环境之下,人工智能也将对人类起到非常大的辅助作用。人类的智慧将被大大解放,仅仅使用在需要突破和创新的领域,而不用去做简单重复的劳动。“人类智能的特点是发现新事物,创造新方法。”张国峰对第一财经记者表示,“比如在游戏中,当人类玩家在通过技能无法战胜对手的情况下,就会想出‘旁门左道’,用诸如网络攻击等方法使得对方down机来获胜,这是AI无法做到的。”

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190125A1BKNT00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券