首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

彻底解决AI视觉深度估计

深度估计是一个不适定问题;不同形状或尺寸的物体,即使在不同距离上,也可能投影到视网膜上的同一图像上。我们的大脑使用多种线索来进行深度估计,包括单眼线索,如运动视差,以及双眼线索,如重影。然而,深度估计所需的计算如何以生物学合理的方式实现尚不清楚。基于深度神经网络的最新方法隐式地将大脑描述为分层特征检测器。相反,在本文中,我们提出了一种将深度估计视为主动推理问题的替代方法。我们展示了深度可以通过反转一个同时从二维对象信念预测眼睛投影的分层生成模型来推断。模型反演包括一系列基于预测编码原理的生物学合理的均匀变换。在非均匀视点分辨率的合理假设下,深度估计有利于采用主动视觉策略,通过眼睛对准对象,使深度信念更准确。这种策略不是通过首先将注意力集中在目标上然后估计深度来实现的;相反,它通过行动-感知循环结合了这两个过程,其机制类似于在物体识别过程中的快速眼球运动。所提出的方法仅需要局部的(自上而下和自下而上的)消息传递,可以在生物学上合理的神经回路中实现。

01
领券