专栏首页机器学习、深度学习空间映射网络--Spatial Transformer Networks

空间映射网络--Spatial Transformer Networks

Spatial Transformer Networks 主要对目标在特征空间做不变性归一化 解决 角度、尺度等变形引入的影响 Code: https://github.com/skaae/transformer_network

首先我们从图像上有个感性认识,对于一个输入图像,我们首先将目标检测出来,用一个四边形框住,然后将这个四边形里的目标图像进行归一化,最后对归一化的目标分类。

原理图如下所示:

目标检测我们使用一个 定位网络, localisation network,这个网络可以是全链接网络也可以是一个卷积网络。但是最后应该有一个位置回归层,用于输出目标的空间参数信息。有了这个空间参数,我们通过坐标映射将目标进行归一化。得到标准大小的图像。最后使用这个归一化后的图像进行分类识别。 定位网络和采样映射机制定义了一个空间映射网络。 The combination of the localisation network and sampling mechanism defines a spatial transformer.

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 二值人脸对齐--Binarized Convolutional Landmark Localizers for Human Pose Estimation and Face Alignment

    Binarized Convolutional Landmark Localizers for Human Pose Estimation and Face A...

    用户1148525
  • GoogleNet - Going deeper with convolutions

    本文针对 ILSVRC14 提出了一个名叫 Inception 的深度卷积网络架构,主要是通过充分利用网络内的计算资源来提升网络性能,具体是通过在增加网络的宽...

    用户1148525
  • 批量残差网络-Aggregated Residual Transformations for Deep Neural Networks

    Aggregated Residual Transformations for Deep Neural Networks Facebook AI Rese...

    用户1148525
  • 谈一谈javascript面向对象

    面向对象语言有个标志=>它们都具有类的概念,通过类可以创建任意多个具有相同属性和方法的对象。 面向对象有三大特性

    陌上寒
  • 【AI不惑境】网络的宽度如何影响深度学习模型的性能?

    网络更深带来的一个非常大的好处,就是逐层的抽象,不断精炼提取知识,如下图第一层学习到了边缘,第二层学习到了简单的形状,第三层开始学习到了目标的形状,更深的网络层...

    用户1508658
  • 中兴认罚17亿美元,美商务部解除对中兴7年禁购令

    新智元
  • 我们用 RNN 分析了最流行的音乐,只想为你写首歌

    RNN(Recurrent Neural Networks,循环神经网络)不仅会学习当前时刻的信息,也会依赖之前的序列,这种独特的优势非常适合用于处理时间序列和...

    DT数据侠
  • 【技术】使用Tensorflow对象检测接口进行像素级分类

    AiTechYun 编辑:yuxiangyu 在过去,我们使用Tensorflow对象检测API来实现对象检测,它的输出是图像中我们想要检测的不同对象周围的边界...

    AiTechYun
  • 我们分析了最流行的歌词,教你用 RNN 写词编曲(附代码)

    翻译 | 余若男 李振 吴章勇 整理 | 凡江 此文展示了基于 RNN 的生成模型在歌词和钢琴音乐上的应用。 介绍 在这篇博文中,我们将在歌词数据...

    AI研习社
  • 【答疑解惑】i++,++i,i+=的区别

    说起这个i++, ++i 入门练习都会搞这个,一如既往,百试不爽。 表达式 a = i++; 它等价于 a = i ; i = i + 1; 表达式 a = ...

    程序员互动联盟

扫码关注云+社区

领取腾讯云代金券