DeepMind的AI学会了将平面图像转换为3D场景

谷歌位于英国的姊妹公司DeepMind最近开发了一种人工智能,它可以在将整个场景视为平面2D图像之后以3D渲染整个场景。

大框架:在尖端的AI研究人员正在试图教机器学习像人类一样。我们不是以像素为单位看世界,而是环顾我们的环境并对其中的一切进行假设。如果我们能够看到某人的胸部,我们就会假设他们也有一个背部,即使从我们的角度来看它可能不可见。

如果你和宝宝一起玩‘’傻瓜‘’,他们会发现即使用手遮住脸,你的脸仍然存在。这基本上就是DeepMind的团队用他们的机器做的事情:他们训练了一个人工智能如何从未见的角度猜测事物的样子。

细节: DeepMind的科学家提出了一个生成查询网络(Generative Query Network,GQN),这是一个神经网络,旨在教AI如何从不同的角度想象物体的场景会是什么样子。基本上,AI观察场景的平面2D图片,然后尝试重新创建它。在这种情况下,重要的是DeepMind的人工智能不使用任何人为标记的输入或以前的知识。它只观察三幅图像,并开始预测场景的3D版本是什么样子。

想想它就像拍摄一个立方体的照片,并要求AI从不同的角度呈现相同的图像。像灯光和阴影之类的东西会改变,以及组成立方体的线条的方向。人工智能 - 使用GQN--必须想象从实际上从未实际观察过的角度,立方体会呈现什么样子,以呈现所请求的图像。

影响:研究人员正在努力实现“完全无监督的场景理解”。目前人工智能尚未接受真实世界的图像训练,因此下一步将从照片中渲染逼真的场景。

未来,DeepMind的基于GQN的AI可以生成与现实世界几乎完全相同的按需3D场景,只使用照片。

  • 发表于:
  • 原文链接https://thenextweb.com/artificial-intelligence/2018/06/29/deepminds-ai-learned-to-turn-flat-images-into-3d-scenes
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券