内容提要
多视点立体MVS是主动深度探测精度与单目深度估计实用性之间的黄金分割点。采用3D卷积神经网络(CNNs)的基于cost volume的方法大大提高了MVS系统的精度。然而,这种准确性产生了很高的计算成本,也阻碍了实际的使用。与cost volume方法不同,我们提出了一种有效的深度估计方法,首先检测和评估兴趣点的描述子,然后学习匹配和三角化一个小的兴趣点集,最后使用神经网络对这个稀疏的3D点集进行加密。一个端到端的网络在深度学习框架内有效地执行了上述三个步骤,并通过中间的2D图像和3D几何监督和深度监督进行训练。
在所有现有的基准测试中,我们已经超过了最先进的结果,并证明了与竞争方法相当的计算效率。在未来的工作中,我们将在兴趣点匹配中引入更有效的注意机制,以及更多支持视图选择的锚点。利用截断符号距离函数(TSDF)或类似的表示方法来联合学习深度和整个场景是另一个有前途的方向。最后,我们期望与SLAM问题进行更深入的整合,因为深度估计和SLAM是互为对偶的。
主要框架及实验结果
声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请加上文微信联系删除。
知识星球:分享最新的CVPR、ECCV、ICCV、IROS等人工智能论文,关注深度学习、自动驾驶领域。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有