该算法在数据分析方面大大优化,助力AR、VR等相关领域的发展。
近日,伯克利的AI研究人员发布新的算法,该算法根据物体的单幅二维图像信息,就可以快速地将其三维结构构造出来。
虽然对于人类而言,根据物体的单面信息推测出东西的整体形状很容易做到,但是对于机器而言,这一过程十分艰难,因为增加一个维度意味着要增加大量的数据。
具体来看,当你拍一张照片,每一边的像素点数是100,那这张图像的像素点数一共就是一万个。但是如果你想增加一个维度,也就是增加一边,假设增加的新边像素点数仍然是100,那整体像素点数将增加一百倍。如果稍微追求精度,单边像素选用128,整体像素点将增加两百倍。不言而喻,数据量的增加是成数量级的。
同时为了确保不失真,图像的每一个像素点及像素点之间的关系都要计算分析,如果想要高精度,那计算量就将十分巨大。
对此很多研究人员都以提升硬件处理速度来弥补算法运行数据量巨大这一不足,但运行速度依然十分之慢,不过伯克利人工智能实验室的Christian Häne却指出,事实上,我们不是在计算和重建100x100x100的整体,而只是描述一个对象的表面,至于表面以外或以内的空间,我们都可以不用管。
所以,首先他以很低的分辨率对2D图像进行3D重建,接着抛去表面以外的数据部分,对保留的区域进行更高分辨率的渲染,以此循环重复,从而以较高速率和精度实现了对物体3D空间的重构。
笔者认为,这一定不是最佳解决方案,但是Christian Häne对数据的筛选方法上的改进是对算法本身很好的一次优化,提升了计算机处理的速度和精度,有助于AR和VR中更迅速和精准的对象跟踪。