首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

新技术:“飞行时间相机”根据光线的回响生成3D图像

【数码爱好者 综合】想象一下,对着一只动物大喊大叫,然后从回音中分辨出它是狗还是马。一个科学家小组已经完成了这一技巧的摄影等价物:他们通过调整光线反射到一个简单探测器上的时间来梳理出一个场景的三维图像。这项被称为时间成像的新技术展示了一种叫做机器学习的人工智能的力量,能够在看似仅仅是噪音的情况下挖掘信息建模。

加州大学伯克利分校的计算机科学家和电气工程师劳拉·沃勒说:“我很惊讶于他们能从这个系统中得到的任何东西,因为从中绝对没有足够的信息,这恰恰说明了机器学习解决似乎无法解决的问题的能力。”

在传统摄影中,物体反射环境光,镜头将其聚焦在由微小的感光元件或像素组成的屏幕上。图像是反射光产生的亮斑和暗斑的图案。所谓的“时间相机”甚至可以增加深度,通过精确计时物体反射到不同像素的闪光来制作3D图像。

近几十年来,研究人员已经发明了更微妙的方式来捕获图像--仅使用一个像素探测器。要做到这一点,他们公开对象不均匀的照明,但不同模式的闪光,隐约像QR条形码codes-those小广场上发现的包装。每个模式将反映对象的不同部分,所以由像素随光强测量模式。通过追踪这些变化,研究人员可以重建物体的图像。

近几十年来,研究人员发明了更巧妙的方法,仅用一个像素探测器就能捕捉到图像。为了做到这一点,他们不把物体暴露在均匀的光照下,而是暴露在不同的光照模式下,这些闪光模模糊糊地类似于包装上的方形条形码。每个图案都会反射出物体的不同部分,因此像素测量的光强度会随图案而变化。通过跟踪这些变化,研究人员可以重建物体的图像。

现在,格拉斯哥大学的数据科学家亚历克斯·特平和物理学家丹尼尔·法西奥及其同事发明了一种只用单一像素就能生成3D图像的方法,但不需要有图案的闪光。利用闪电般快速的单光子探测器,他们用均匀的闪光照亮了一个场景,并简单地测量了反射时间。探测器的精度为1/4纳秒,它计算到达的光子数是时间的函数。仅凭这些信息,研究人员就重建了现场的图像。

沃勒说,这令人惊讶,因为原则上场景中物体的排列和时间信息之间没有一一对应的关系。例如,从离探测器3米远的任何表面反射的光子将在10纳秒内到达,不论它朝向哪里。乍一看,这种模棱两可似乎使问题无法解决。

为了克服这个问题,特平和他的同事们使用了一种叫做神经网络的机器学习程序,训练它来检测输入和输出之间的细微关联。研究人员用闪光灯和探测器记录了一到两个人在实验室固定的、不对称的背景场景前移动的数据,同时,他们使用"飞行时间照相机"记录下现场的真实3D图像。

研究人员上周在Optica上报道说,在使用这两个数据集训练神经网络后,该程序能够自行对在场景中移动的人进行成像。与飞行时间相机相比,时间图像模糊,缺乏细节。然而,它们清楚地揭示了人的形状。

一个由人工智能驱动的系统利用光的回声来制作一部3D电影(左),尽管它的分辨率比3D相机的低。

神经网络能够破译这些模糊的信号,因为,由于它的训练,它将试图只召唤出与它已经看到的相似的场景和物体。但这意味着该系统也有局限性:它必须在它将要观测的精确场景上进行训练。

“我们需要背景,”特平说。“如果没有背景,它就会停止工作。”他说,面对一个全新的场景,这个系统很可能会产生一个错误的想象,就像它训练的场景一样。

时间成像系统比普通成像系统有一些优势,例如,新系统可能非常快,可能以每秒1000帧的速度工作。这种粗糙但快速的三维成像技术可能有多种应用。(想想,在自动驾驶的汽车上踩刹车)这个系统也便宜又简单。理论上讲,一个技术爱好者可以使用普通笔记本电脑和无线路由器的无线电天线监视一个房间。

不过,沃勒说,鉴于实际相机已经相当便宜,还不清楚这个系统会有多有用。相反,她说,实验提出了一个有趣的概念性问题:神经网络究竟是如何学习制作合理图像的?“为什么有用?”她问道。“它的物理原理是什么?沃勒说,挑战不仅仅是把神经网络当作一个黑匣子来使用,还要真正弄清楚它在做什么。

END

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200810A0TOR700?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券