AI会打游戏已经不是新鲜事了。微软AI打出吃豆人史上最高分,暴雪和DeepMind开发工具包教AI打星际2,用神经网络和遗传算法搭建玩Flappy Bird的AI,甚至……连DOTA顶级选手都被AI完爆。AI不断解锁新游戏,还玩得6的飞起。
相比之下,乔治亚理工学院的这项研究有些与众不同,计算机学院的Matthew Guzdial、Boyang Li、Mark O.Reiedl三人想让AI学习制作游戏。曾是“网瘾少年”的AI,也要浪子回头步入游戏制作的正经行业了?
在论文《Game Engine Learning from Video》中,Guzdial等人描述了一种AI系统,可在围观别人打超级玛丽后重新创造一个游戏引擎。AI系统无法获取代码,但能通过观察像素学习。重建的游戏引擎有些地方看起来不太合理,但总体看还说得过去。
这是世界首个AI创造的游戏,创造过程不易,研究人员遇到了很多困难和限制条件。万事开头难,AI没有从头开始学习过游戏。
对此,研究人员为它提供了两个数据集:一个是游戏中各种小怪的视觉词典,另一个包含了物体位置和移动速度等基本概念,AI通过这些分析它看到的场景。
△ 超级玛丽的男一和男二:马里奥与板栗仔
依靠这两个数据集,AI将游戏情节逐帧分解,并给所见的东西打上标签,自动寻找行为规则。
在接受外媒The Verge采访时,Guzdial举例解释了AI的学习过程。“解析器分析并收集每一帧画面,比如马里奥的状态、移动速度等,”Guzdial说,“某一帧马里奥踩在板栗仔上,下一帧板栗仔就消失了。根据看到的这个场景AI学习到的新规则,当马里奥踩在板栗仔上且速度为负时,板栗仔消失。”
△ 无穷马里奥中框架解析过程的可视化
随着训练时间增加,AI将逐步建立起所有小规则,之后将它们记录成一系列逻辑语句并组合起来近似组成游戏引擎。这些规则可以被导出并转换成很多编程语言,我们又可以用这些语言重新创造新的超级玛丽游戏。
智能体需要去预测环境。在这篇论文中,我们提出了一种通过对输入像素的简单搜索学习正向仿真模型的新方法。
我们用游戏超级玛丽初步测试这种方法,超级玛丽代表了没有现实情况这么复杂的物理系统。我们证明了这种方法在预测未来状态上比CNN基线有显著提高,并用学习过的模型训练游戏智能体。最后,我们依据输出模型的准确性和数值来评估算法。
目前,这个系统还依赖人类定义在特定游戏中可能发生的事情,因此只能在2D平台上工作,定义3D游戏还需要更多时间以及更先进的机器视觉工具。
Guzdial团队认为,在未来,这项技术不仅可以推导出游戏原理,还有应用在现实生活中的潜力。虽然这比超级玛丽游戏要复杂得多,但并不是一个不可能的想法。“我认为未来的版本可以(分析)有限的现实领域。”Guzdial说。
最后,附上论文地址:
https://www.cc.gatech.edu/~riedl/pubs/ijcai17.pdf
也可在量子位微信公众号(ID:qbitai)会话界面回复“超级玛丽”直接下载这篇论文。