虚拟世界中可能蕴含着通往普通人工智能的道路
━━━━
如果人工智能(AI)主体要利用其机械能力对人类进行补充,成为社会的真正参与者,那么它们必须首先成为电子游戏《我的世界》的玩家。要在《我的世界》中证明自己,它们必须一起在迷宫中捕捉动物、建造积木塔,在与骷髅战斗的同时寻找宝藏。
在微软、伦敦玛丽女王大学和crowdAI(一个数据科学挑战平台)组织的竞赛中,协作是参赛的前提条件。本月,主办方将宣布获胜者——该团队创造的AI能最细致准确地观察其在《我的世界》中所处的环境,确定必须完成3个任务中的哪一个,然后与另一个AI主体合作完成这个任务。
通过强调适应性与合作,组织者旨在鼓励对AI主体进行研究,使其有朝一日能够与人类互动,在现实世界中完成任务。虽然真正能够与人类智力相匹配的AI仍然只存在于科幻小说里,但研究人员可以在《我的世界》中朝着通用人工智能(AGI)的目标迈出有意义的一步。
马尔默多主体强化学习(MARLO)比赛是马尔默项目(Project Malmo)的一个分支,该项目于2015年由英国微软剑桥研究院的AI研究员卡特娅•霍夫曼(Katja Hofmann)发起。尽管很多令人兴奋的AI研究都涉及了AI对国际象棋和围棋等策略游戏的掌握,但霍夫曼一直在寻找一款能够让AI学习更广泛技能的游戏。
“很明显《我的世界》是一个进行AI研究的完美环境,”她表示,“这是一个没有预设目标的世界。”马尔默项目是一个建立在《我的世界》之上的平台,在这个平台上,研究人员可以进行许多不同种类的AI试验,同时也可以通过标准化的方式比较试验结果。
在2017年首届马尔默多主体强化学习挑战赛中,AI主体被要求执行捕捉一头猪的单一任务。2018年的比赛则提高了难度,组织者设计了3个需要合作的任务。AI参赛者必须学会在环境中识别另一个AI主体,然后找到一种协作方法,一起为了相同的目标共同努力。
一个能够对另一主体的目标进行假设的AI主体,将具备心理学家所说的“心智理论”的基本形态,即人类将精神状态和意图归因于他人的能力。霍夫曼希望AI主体最终能够通过与《我的世界》中的人类玩家合作来锻炼这种能力。“然后,算法就可以学会与人类合作,”她说,“并了解人类想要什么。”
在马尔默多主体强化学习比赛中,AI通过强化学习得到了训练。在强化学习中,AI在反复试验的过程中学习。每个团队的AI都是从随机的动作开始,并观察它们对游戏的影响。比赛环境在游戏中设有奖励,因此AI会因为某些成果而得分。最终,AI找到让自己得分的行动,该行动可以使其捕获一只鸡或找到宝藏。虽然强化学习算法在这些训练中起到了主要作用,但每个马尔默多主体强化学习团队都有自己的策略来加快学习或提高学习效率。
旧金山非营利研究机构OpenAI的多主体研究负责人伊戈尔•莫达奇(Igor Mordatch)表示,《我的世界》只是AI研究人员目前采用的众多复杂电子游戏之一。OpenAI没有太关注《我的世界》,而是创造了可以玩多人电子游戏Dota2的AI主体。
“我们正在为强化学习建立一个良好的生态环境系统和基准。” 莫达奇说。“但是现在面临着一个挑战,就是我们如何确定AI在这些游戏中学到了有用的东西?”
霍夫曼说,在《我的世界》中取得成功的AI主体,在其他电子游戏中也很可能取得成功。AI很有可能做到为游戏中的非玩家角色提供帮助,比如赋予这些角色与人类玩家自然交互和合作的能力。
在马尔默多主体强化学习挑战赛中,一位参赛者了解了更多的AI的实际应用。韩国电子通信研究院(ETRI)研究员李东韩(Donghun Lee)则致力于让他的AI主体进行有效沟通,表达意图。他说AI的这种能力将直接用于他的物联网研究。李东韩表示,智能设备的普及带来了通信问题,因为现在许多联网设备需要协同工作。他还说:“在云端同时操作所有这些设备并不容易,但是有了多主体强化学习,物联网设备可以解决如何协同工作的问题。”
作者:Eliza Strickland
领取专属 10元无门槛券
私享最新 技术干货