首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

经典/深度SfM有关问题的整理[通俗易懂]

这篇博客主要是记录一些实践或看论文过程中遇到的一些不好理解的问题及解释。 Q1:SfM里的尺度不变性指的是什么? A1:一般定义下,尺度不变性是指体系经过尺度变换后,其某一特性不变。比如,特征点检测算法SIFT,其检测到的特征点的尺度不变性是通过图像金字塔来实现的。这样,不管原图的尺度是多少,在包含了所有尺度的尺度空间下都能找到那些稳定的极值点,这样就做到了尺度不变。关于SIFT尺度不变性的更详细讲解,可以参考这篇博客。 Q2:单目相机SfM重建结果的尺度是怎么确定的? A2:传统方法中,单目重建是无法获取重建场景的尺度信息的。因此,要确定重建的尺度,需要使用额外的手段。比如:

02
您找到你想要的搜索结果了吗?
是的
没有找到

【SLAM】开源 | VO基于几何的方法和深入学习的单目视觉里程计算法,性能SOTA

在这项工作中,本文提出了一个基于几何的方法和深入学习的单目视觉里程计(VO)算法。大多数现有的优异性能的VO/SLAM系统都基于几何学特征的算法,必须针对不同的应用场景进行精心设计才能达到较好的效果。此外,大多数单目系统都存在尺度漂移问题。最近的一些深度学习工作以端到端的方式实现VO功能,但是这些深度系统的性能仍然无法与基于几何的方法相比。在这项工作中,我们回顾了VO的基础知识,并探索了如何将深度学习与极线几何和透视投影(PnP)方法相结合。具体地说,我们训练了两个卷积神经网络(CNNs)来估计单目深度和并且输出双目视觉中的光流特征。在深度预测的基础上,我们设计了一种简单而稳健的帧到帧VO算法(DF-VO),其性能优于纯深度学习和基于几何的方法。更重要的是,我们的尺度一致的单视角深度CNN系统不受尺度漂移问题的影响。在KITTI数据集上的大量实验表明了系统的鲁棒性,详细的研究表明了系统中不同因素的影响。

02

SIGIR2020 | 内容感知的神经哈希协同过滤方法

文章于2020年发表在SIGIR上,提出了一个内容感知的神经哈希协同过滤方法(NeuHash-CF模型)。论文主要对DCMF[1]和DDL[2]两个模型进行了对比,DCMF和DDL这两个模型尽管在标准的推荐设置和冷启动设置下都获得了较好的性能提升,但是这两个模型在为冷物品生成哈希码时所用方式与非冷物品所用方式不同。换句话说,这两个模型均不是学习在冷启动设置下的哈希码,而是将其作为一个子目标。在冷启动设置下,如何将内容特征映射到哈希码中,这样一种方式极大地限制了哈希码在冷启动设置下的泛化能力。因此,作者基于这两个模型的不足,提出了NeuHash-CF模型。

01

深度学习基础入门篇[七]:常用归一化算法、层次归一化算法、归一化和标准化区别于联系、应用案例场景分析。

那么什么是量纲,又为什么需要将有量纲转化为无量纲呢?具体举一个例子。当我们在做对房价的预测时,收集到的数据中,如房屋的面积、房间的数量、到地铁站的距离、住宅附近的空气质量等,都是量纲,而他们对应的量纲单位分别为平方米、个数、米、AQI等。这些量纲单位的不同,导致数据之间不具有可比性。同时,对于不同的量纲,数据的数量级大小也是不同的,比如房屋到地铁站的距离可以是上千米,而房屋的房间数量一般只有几个。经过归一化处理后,不仅可以消除量纲的影响,也可将各数据归一化至同一量级,从而解决数据间的可比性问题。

03

图像处理之gamma校正

在电视和图形监视器中,显像管发生的电子束及其生成的图像亮度并不是随显像管的输入电压线性变化,电子流与输入电压相比是按照指数曲线变化的,输入电压的指数要大于电子束的指数。这说明暗区的信号要比实际情况更暗,而亮区要比实际情况更高。所以,要重现摄像机拍摄的画面,电视和监视器必须进行伽玛补偿。这种伽玛校正也可以由摄像机完成。我们对整个电视系统进行伽玛补偿的目的,是使摄像机根据入射光亮度与显像管的亮度对称而产生的输出信号,所以应对图像信号引入一个相反的非线性失真,即与电视系统的伽玛曲线对应的摄像机伽玛曲线,它的值应为1/γ,我们称为摄像机的伽玛值。电视系统的伽玛值约为2.2,所以电视系统的摄像机非线性补偿伽玛值为0.45。彩色显像管的伽玛值为2.8,它的图像信号校正指数应为1/2.8=0.35,但由于显像管内外杂散光的影响,重现图像的对比度和饱和度均有所降低,所以彩色摄像机的伽玛值仍多采用0.45。在实际应用中,我们可以根据实际情况在一定范围内调整伽玛值,以获得最佳效果。

01
领券