首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

现有的深度卷积神经网络(CNNs)需要一个固定大小的输入图像(如224×224)。这一要求是“人为的”,可能会降低对任意大小/尺度的图像或子图像的识别精度。在这项工作中,我们为网络配备了另一种池化策略,“空间金字塔池”,以消除上述要求。这种新的网络结构称为SPP-net,可以生成固定长度的表示,而不受图像大小/比例的影响。金字塔池对物体变形也有很强的鲁棒性。基于这些优点,SPP-net一般应改进所有基于cnn的图像分类方法。在ImageNet 2012数据集中,我们证明了SPP-net提高了各种CNN架构的准确性,尽管它们的设计不同。在Pascal VOC 2007和Caltech101数据集中,SPP-net实现了最先进的分类结果使用单一的全图像表示和没有微调。在目标检测中,spp网络的能力也很重要。利用SPP-net算法,只对整个图像进行一次特征映射计算,然后将特征集合到任意区域(子图像),生成固定长度的表示形式,用于训练检测器。该方法避免了卷积特征的重复计算。在处理测试图像时,我们的方法比R-CNN方法快24-102×,而在Pascal VOC 2007上达到了更好或相近的精度。在2014年的ImageNet Large Scale Visual Recognition Challenge (ILSVRC)中,我们的方法在所有38个团队中目标检测排名第二,图像分类排名第三。本文还介绍了本次比赛的改进情况。

02

Sub-Category Optimization for Multi-View Multi-Pose Object Detection

外观变化大的目标类别检测是计算机视觉领域的一个基本问题。由于类内部的可变性、视角和照明,目标类别的外观可能会发生变化。对于外观变化较大的目标类别,需要使用基于子类别的方法。本文提出了一种基于外观变化自动将一个目标类别划分成适当数量的子类别的子类别优化方法。我们没有使用基于领域知识或验证数据集的预定义的类内子分类,而是使用基于鉴别图像特征的非监督聚类来划分样本空间。然后利用子类别判别分析验证了聚类性能。基于无监督方法的聚类性能和子类别判别分析结果,确定了每个目标类别的最优子类别数。大量的实验结果显示使用两个标准和作者自己的数据库。比较结果表明,我们的方法优于最先进的方法。

04

Nat. Mach. Intel. | 可解释性图像识别的概念白化方法

今天给大家介绍的是ZhiChen等人在Nature Machine Intelligence上发表的文章“Concept whitening for interpretableimage recognition”。机器学习中的可解释性无疑是重要的事情,但是神经网络的计算通常是很难理解的。在这里,论文不是试图事后分析一个神经网络,而是引入一种称为概念白化(CW,concept whitening)的机制来改变网络的一个给定层,使我们能够更好地理解该层的计算。当CW模块被添加到卷积神经网络时,潜在空间被白化(即,去相关和归一化),并且潜在空间的轴会与已知的感兴趣的概念对齐。通过实验,论文发现CW可以使我们更清楚地了解网络是如何通过分层学习概念的。CW是BatchNormalization(BN)层的一种替代方法,因为它对潜在空间进行了标准化,也进行了去相关(白化)。CW可以用于网络的任何一层而不影响预测性能。

03
领券