SPPnet在这个想法上继续加入SPM的思路,SPM主要的思路就是对于一幅图像分成若干尺度的一些组块,比如一幅图像分成1份,4份,8份等。...SPPnet首次将这种思想应用在CNN中,对于卷积层特征我们首先给它分成不同的尺寸,然后每个尺寸提取一个固定维度的特征,最后拼接这些特征就是一个固定维度的输入了。
上篇文章详细阐述了R-CNN网络模型,本篇本章本来准备阐述Fast-RCNN模型的,介于SPP-Net模型有许多技巧性的技术可以在不同模型上使用,所以本篇详细分析下SPP-Net SPPNet...论文:https://arxiv.org/abs/1406.4729 SPPNet论文翻译:https://blog.csdn.net/mengduanhonglou/article/...总结 :SPPNet相对来说,创新点即是惊艳的地方,共享卷积和金字塔池化操作。共享卷积缩短了几十倍的时间,任意尺度保留了数据的原始信息,并且这个技巧可以优化所有用到FC的网络模型。
SPPnet 2.1 SPP层的原理 2.2 SPPnet的区域映射原理 3....针对R-CNN存在的第一个缺点,SPPNet提出了著名的空间金字塔池化(Spatial Pyramid Pooling,SPP),实现了将任意大小的输入转化成固定大小的输出。...SPPNet怎么实现将基于全图的候选区域映射成基于feature map的区域? 2....总结 R-CNN SPPNet R-CNN是让每个候选区域经过crop/wrap等操作变换成固定大小的图像 SPPNet把全图塞给CNN得到全图的feature map,让候选区域与feature map...SPPnet缺点也很明显,CNN中的conv层在微调时是不能继续训练的。它仍然是R-CNN的框架,离我们需要的端到端的检测还差很多。
SPPnet详解 RCNN系列:RCNN,SPPNet,Fast RCNN,Faster RCNN,R-FCN。...作者是何凯明 SPPNet出现的原因 之前的网络,比如LeNet,AlexNet,ZF,VGG等,它们的输入都是固定大小的,为什么要固定大小呐?原因就在最后连接的全连接层上。...对此SPPnet提出的解决方案是在最后一层卷积层后用空间金字塔池化层(Spatial Pyramid Pooling)代替普通池化层。
在测试时,SPPnet 比 RCNN 快了 24-102 倍。...SPPnet 就是用来去掉定长这一限制的。...只需要在整张图片上提取特征一次,然后在 feature map 上用 SPPnet 来提取特征。...Multi-size training SPPnet 可以接受任意尺度的图像。...SPPnet 从整张图只提一次特征,然后通过 SPP layer 在每个 window 上提定长向量的特征。 Fast RCNN 和 SPPnet 有什么区别?
Multi-size training 作者使用caffe训练SPPnet网络,但是caffe不支持多尺寸图片输入,为了实现多尺寸训练,作者实现两个网络,一个网络输入224×224大小的图片,另一个网络输入
5.3 SPPNet 学习目标 目标 知道SPPNet与RCNN的对比特点 掌握空间金字塔池化(spatial pyramid pooling)的原理和作用 掌握SPPNet的训练过程以及测试结果对比...知道SPPNet优缺点总结 应用 无 5.3.1 SPPNet介绍 针对之前R-CNN的缺点,我们来看 1、每个候选区域都进行了卷积操作提取特征,计算量大速度低效。...5.3.1.1 SPPNet与RCNN对比 方法:SPPNet引入一种空间金字塔池化( spatial pyramid pooling,SPP)层以移除对网络固定尺寸的限制。...看图理解: 卷积网络训练注意点: SPPnet在微调时不能更新空间金字塔池化层之前的卷积层参数,这一点限制了深度网络的精度。关于最后一点其实不准确,SPPnet也可以反向传播,但是会很复杂。...回归器, SPPNet反向传播效率低 5.3.3 总结 SPPNet与RCNN的对比特点 SPPNet SPP层原理过程、映射过程 SPPNet的训练过程以及测试结果对比 SPPNet
输出任意大小的特征映射,而全连接层由于本身的性质需要输入固定大小的特征尺度,所以固定尺寸的需求来自于FC层,即使对输入图片进行裁剪、扭曲等变换,调整到统一的size,也会导致原图有不同程度失真、识别精度受到影响】SPPNet...(10 view指10次crop test,包括在四个corner+中心+相应的水平翻转进行的crop) SPPNet in Object Detection 以上的内容都是在讲解SPPNet的作用和使用方法...,具体到目标检测领域,SPPNet在卷积得到的特征映射上对于每个建议框的映射区域(由selective search等方法产生)进行空间金字塔池化输出固定长度的向量并送入全连接层,有以下步骤: 与RCNN...一样,Selective Search 用于产生2K个region proposals(bounding boxes) 输入图像使用ZFNet(之前图表有说明)经过SPPNet仅仅一次 最后一层卷积得到整张特征映射...SPPNet for Object Detection 与R-CNN相比,SPPNet仅在conv层处理图像一次,而R-CNN在卷积层处理图像2k次,因为存在2k个region proposal。
SPPNet则改成了直接先对整张图片进行特征抽取。再在这一大张feature map上,接上一个SPP layer: ?...和R-CNN一样,SPPNet的输入也包括两部分: 1batch的输入图像 selective search算法对应每个输入图像生成的一系列proposal 另外,SPPNet还设计了全新的SPP layer...Innovation SPPNet有两个最大的创新点:特征抽取共享化、SPP layer。...可以说,SPPNet推动了Detection的发展。 SPP layer :该layer可以 适应任意size和宽高比的输入图像。 Result 在VOC 2007上的结果: ?...SPPNet检测效果图: ? Thinking SPPNet有两大划时代的贡献: 特征抽取共享化; 对RoI进行pooling。 SPPNet是一个被人忽视的杰出贡献。
小菜看了SPPNet这篇论文之后,也是参考了前人的博客,结合自己的一些观点写了这篇论文总结。...paper主页:http://research.microsoft.com/en-us/um/people/kahe/eccv14sppnet/index.html 这个算法比R-CNN算法的速度快了n
何凯明团队的SPPNet给出的解决方案是,既然只有全连接层需要固定的输入,那么我们在全连接层前加入一个网络层,让他对任意的输入产生固定的输出不就好了吗?...空间金字塔池化层 上图的空间金字塔池化层是SPPNet的核心,其主要目的是对于任意尺寸的输入产生固定大小的输出。...SPPNet应用于图像分类 SPPNet的能够接受任意尺寸图片的输入,但是训练难点在于所有的深度学习框架都需要固定大小的输入,因此SPPNet做出了多阶段多尺寸训练方法。...SPPNet应用于目标检测 SPPNet理论上可以改进任何CNN网络,通过空间金字塔池化,使得CNN的特征不再是单一尺度的。...但是SPPNet更适用于处理目标检测问题,首先是网络可以介绍任意大小的输入,也就是说能够很方便地多尺寸训练。
); 然而svm训练的时候,因为svm适用于少样本训练,所以对于训练样本数据的IOU要求比较严格,我们只有当bounding box把整个物体都包含进去了,我们才把它标注为物体类别,然后训练svm SPPnet
简介 SPPNet的英文名称是Spatial Pyramid Pooling Convolutional Networks,翻译成中文是“空间金字塔池化卷积网络”。...paper地址https://arxiv.org/pdf/1406.4729.pdf 原理 SPPNet主要做了一件事:将CNN的输入从固定尺寸改进为任意尺寸。...SPPNet在普通的CNN结构中加入了ROI池化层(ROI Pooling),使得网络的输入图像可以是任意尺寸的,输出则不变,同样是一个固定维数的向量。
当然了,这个层数是可以随意设定的,以及这个图片划分也是可以随意的,只要效果好同时最后能组合成我们需要的特征个数即可 这就是sppnet的核心思想,当然在这个模型中,何大神还对RCNN进行了优化,...然后经过尝试,这种方法是可行的,于是在RCNN基础上,进行了这两个优化得到了这个新的网络sppnet. ...值得一提的是,sppnet提出的这种金字塔池化来实现任意图片大小进行CNN处理的这种思路,得到了大家的广泛认可,以后的许多模型,或多或少在这方面都是参考了这种思路,就连 rg大神,在后来提出的fast-rcnn
从R-CNN 到Fast R-CNN,有必要了解下SPPNet,其全称为Spatial Pyramid Pooling Convolutional Networks(空间金字塔池化卷积网络)。...SPPNet在普通的CNN结构中加入了ROI池化层(ROI Pooling)使得网络输入图像可以为任意size,而保证了输出维度是固定的向量。...R-CNN和SPPNet的不同点在于,R-CNN要对每个区域计算卷积,而SPPNet只需要计算一次,因此SPPNet的效率比R-CNN高得多。...R-CNN和SPPNet的相同点在于,他们都遵循着提取候选框,提取特征,分类几个步骤,提取特征后都使用SVM进行分类。
SPPNet ECCV 2014 Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition...SPPNet缺点:它的训练要经过多个阶段,特征也要存在磁盘中,另外,SPP中的微调只更新spp层后面的全连接层,对很深的网络这样肯定是不行的。...(这里是借鉴了SPPNet中的 SPP网络层,比SPP网络层简单,只用一个尺度) 4)继续经过两个全连接层(FC)得到特征向量,RoI feature vector。...我们先来看看 Fast RCNN 是怎么做的,然后再回过头来看看 SPPNet又是怎么干的,这样一对比就比较容易理解。...很明显 Fast RCNN 要比 R-CNN 和 SPPnet 快64倍。这里也可以看出 SPPnet 不能同时微调卷积和全连接层的参数主要是速度太慢。
由于SPPnet的优点通常应该独立于体系结构,我们期望它将进一步改进更深和更大(deeper and larger)的卷积体系结构。...表10中,我们进一步使用相同预训练的SPPnet模型(ZF-5)和R-CNN进行比较。本例中,我们的方法和R-CNN有相当的平均成绩。R-CNN的结果是通过预训练模型进行提升的。...这是因为ZF-5比AlexNet有更好的架构,而且SPPnet是多层次池化(如果使用非SPP的ZF-5,R-CNN的结果就会下降)。 表11表明了每个类别的结果。表11也包含了其他方法。
---- 【SPPnet比RCNN好在哪里?】...总之,这样RCNN需要卷积2000个候选框,而SPPNet只需要卷积一次,速度提升了100倍。...(最后需要提的一点是,我并不清楚SPPNet最后的分类是用FC层还是依然使用RCNN的SVM分类,不知道SPPNet是否使用了线性回归的方法做边框回归。...因为我只是把SPPNet看成提出了ROI pooling的一个方法,是RCNN进化史中的一个插曲。不过在意的朋友可以自行查找,然后方便的话告诉我哈哈哈,我懒得搞了。...【Fast RCNN的贡献】再说一下Fast RCNN的改进,其实主要改进都是SPP Net的,用了ROI和先卷积再扣除候选框的方法(SPPNet的两个优点都用了),此外,还是用FC层直接代替了SVM和
领取专属 10元无门槛券
手把手带您无忧上云