西班牙瓦伦西亚理工大学(Polytechnic University of Valencia)计算机科学家埃尔南德斯(José Hernández-Orallo)制定了评估机器智能的方法。他在研究中使用《我的世界》(Minecraft)这款电子游戏之前就已经对其很熟悉了。最开始是看到自己的小孩在三维虚拟世界里玩。这个游戏主要是解决问题而不是射击怪物。
2014年,微软买下了《我的世界》。微软研究院(Microsoft Research)向内部研究人员开放了此款游戏的新版本,允许玩家和计算机程序探索定制三维环境,随后邀请埃尔南德斯等外部研究人员下载了《我的世界》的机器友好版。2015年7月,微软对外发布了免费版,希望可以加速人工智能的发展。
如今其他一些公司也在纷纷效仿:2016年12月3日,谷歌旗下位于伦敦的DeepMind开放了其自主开发的三维虚拟平台“DeepMind Lab”,供外部开发人员下载及定制。该公司最初开发“DeepMind Lab”只是为了训练自己的人工智能程序。两天后,美国加州一家研究公司OpenAI发布了一个“元平台”。通过该平台,人工智能程序可以轻松地与数十款为游戏玩家设计的三维游戏、网络浏览器以及智能手机应用程序交互。
上述三项发布大大方便了研发人员在全新环境下对程序进行测试,并可让程序在与现实世界相似的新环境中通过自主学习实现导航从而获得新技能。美国华盛顿大学(University of Washington)机器学习研究人员表示:“这种环境对于未来的人工智能开发具有非常重要的意义。”
数十年来,游戏一直用于测试人工智能,但算法通常是按预设好的策略来玩游戏。近年来,人们开始关注可以基于自我经验学习的机器。2015年初,DeepMind发布了一种能够自主学习如何在经典雅达利街机游戏中打败人类的新算法。该算法在学习之前并不知晓游戏目标,而是通过反复试误来不断学习。
但这样的游戏仅仅采用的是简单的二维环境,而《我的世界》这种第一人称三维电子游戏是将游戏玩家可视化地嵌入在游戏环境中。这种情境更接近现实世界,因此可作为更复杂的测试平台。
在《我的世界》中,除了在预定义的结构中导航和交互外,用户还可与虚拟砖块交互,用砖块搭建各种结构。现在有了供开发人员使用的版本“Malmo”,让算法也可以做到这一点。例如,埃尔南德斯正在使用Malmo研究该环境是否可用于为机器智能创建基准。人工智能算法可以实现将砖块搭建成最像某个特定对象的物体、穿越迷宫等,其测试内容比图灵测试(Turing Test)更为广泛。图灵测试是机器智能最著名测试,测试人工智能是否能像人类一样会话。
《我的世界》适合作为人工智能测试平台的原因之一就是玩家可以通过文本信息交互。英国微软剑桥研究院(Microsoft Research in Cambridge)研究人员认为,这有助于让人工智能学习如何在现实世界中与人协作。
研究人员表示,虚拟世界对于开发物理机器人这种人工智能非常有用,因为相比现实世界,虚拟环境的定制成本更低,且测试更快更安全。而且通过虚拟环境,研究人员可以只关注机器人的智能部分,而不用分心于物理机器人的机械部分。除了埃尔南德斯,微软研究院还与少数使用Malmo的实验室建立了合作关系。但研究人员认为,使用Malmo的机构远不止这些,大概有100个左右。
研究人员也可通过DeepMind Lab平台构建迷宫等这类结构,它们的算法能够学习穿越迷宫搜集奖励。一位发言人表示,DeepMind也在尝试将一些“更自然的元素”(如起伏的地形与植物)整合到平台环境中去。微软之所以开源这一游戏环境是希望有更多的研究人员参与进来,搭建出对算法更具挑战性的环境。
OpenAI的元平台“宇宙”(Universe)更加先进。该平台为同一人工智能提供多种完全不同的环境进行采样,有助于攻克人工智能领域的一大难题:创建可以利用过去经验解决新问题的人工智能算法。例如,模仿视觉皮层中脑细胞层的深层神经网络可通过快速学习找到走出三维迷宫的方法,但无法利用已学到的知识走出另一迷宫。埃尔南德斯指出,“一旦迷宫的颜色发生变化,系统就完全不知所向。最先进的技术完全失败了。”
微软正在致力于让Malmo在“宇宙”平台运行。OpenAI联合创始人表示,“有了社区平台,将促进各种开发。”