机器之心报道
参与:路雪、李亚洲、黄小天
计算机已经在国际象棋和围棋等经典游戏中打败世界上最厉害的人类。现在又有一台计算机在 Valve 举办的 Dota2 国际锦标赛现场打败了「Dota 2」世界顶级玩家,该赛事奖金高达 2400 万美元。
在 Dota2 一对一表演赛中,由 OpenAI 设计的 bot 打败了 Danylo "Dendi" Ishutin,一名在职业生涯中已经赢得 735,449.40 美元奖金的职业玩家。OpenAI 的 bot 在第一场比赛开始约 10 分钟打败了 Dendi。在第二场比赛中 Dendi 放弃,并拒绝进行第三场比赛。
在人机匹配赛之前,OpenAI CTO Greg Brockman 解释了该公司的特制 bot 接受了一千次比赛的训练,训练由 OpenAI 进行指导。Brockman 还声称这个 bot 已经打败多个「Dota 2」职业玩家。
人工智能公司向来喜欢通过视频游戏测试其技术:DeepMind 选择了星际争霸 2,而微软则在最近宣布要在 Ms. Pac-Man 取得佳绩。Brockman 说,OpenAI 并不打算浅尝辄止,而是希望其 bot 明年可在 Dota 5 对 5 游戏中作战。同时,OpenAI 将会发布该 bot,从而人人可以与其对决,并且举办方 Valve 将为击败该 bot 的第一个人类玩家提供游戏币奖励。
以下是 OpenAI 官方博客对该比赛的介绍:
我们已创建了一个 bot,它在标准联赛规则下的 Dota 2 1 对 1 比赛中击败了人类顶级职业玩家。该 bot 通过自学从头学习 Dota,但并没有使用模仿学习或树搜索。这向构建在涉及真实人类的复杂环境中达成精确目标的人工智能系统迈出了前进的一步。
今天我们在国际赛的主赛场与 Dendi 对战,赢了一场三局两胜比赛。在过去一周中,我们的 bot 在与许多顶级专业玩家,包括 SumaiL(世界 1v1 头号玩家)和 Arteezy(世界头号全能玩家)对战时依然保持不败战绩。
Dota 1v1 是一个具备隐藏信息的复杂游戏。智能体必须学习规划、攻击、设局以及欺骗对手。玩家技能和每分钟操作数(actions-per-minute)之间的关联不是很强,事实上,我们的 AI 的每分钟操作数相当于人类玩家的平均水平。
在 Dota 中取胜需要玩家基于对对手的直觉而采取相应操作。在上面的视频中你可以看到我们的 bot 已经习得了——完全通过自我对弈——预测其他玩家的下一步操作,在陌生的环境中随机应变,以及通过对其他玩家的友军施加影响而帮助前者成功。
一场完整的 Dota 比赛包括两个战队,每队五人。每个玩家需要从一百个英雄和数百种装备之间进行选择。我们下一步将创建一个可与人类战队竞争和合作的 Dota 2 bot 战队。
参考内容:https://blog.openai.com/dota-2/#more
本文为机器之心报道,转载请联系本公众号获得授权。