为什么扩张的卷积层不会降低感受野的分辨率？

扩张的卷积层不会降低感受野的分辨率是因为它使用了稀疏卷积操作，通过跳跃式的卷积核滑动方式来实现。

传统的卷积操作是通过一个固定大小的卷积核在输入特征图上进行滑动，每次滑动一个固定的步长。这种方式会导致感受野的分辨率降低，因为每次滑动步长的增加会导致输出特征图的尺寸减小。

而扩张的卷积层采用了空洞卷积（Dilated Convolution）的方式，它在传统卷积的基础上引入了一个扩张率（Dilation Rate）的概念。扩张率决定了卷积核中间的空洞大小，通过在输入特征图上跳跃式地进行卷积操作，可以在不降低感受野的情况下增加卷积核的有效接受野。

具体来说，扩张的卷积层在进行卷积操作时，卷积核中的每个元素之间会有一定的间隔，这个间隔由扩张率决定。这样一来，卷积核在输入特征图上的滑动步长就变成了原来的步长乘以扩张率。通过增加扩张率，可以在不改变输出特征图尺寸的情况下，增加卷积核对输入特征图的感受野。

扩张的卷积层在图像处理、语音识别、自然语言处理等领域有广泛的应用。在图像处理中，扩张的卷积层可以捕捉到更大范围的上下文信息，有助于提取图像中的全局特征。在语音识别和自然语言处理中，扩张的卷积层可以捕捉到更长的上下文依赖，有助于提高模型对语音和文本的理解能力。

腾讯云相关产品中，可以使用腾讯云的AI智能图像处理服务（https://cloud.tencent.com/product/ai-image）来进行图像处理，包括扩张的卷积层的应用。

相关·内容

【分割模型解读】感受野与分辨率的控制术—空洞卷积

2 空洞卷积一句话概括空洞卷积：调整感受野（多尺度信息）的同时控制分辨率的神器。...很明显，应用空洞卷积后，卷积核中心像素的感受野（也就是一个卷积核能看见的区域）增大了，但是在步长为1的情况下，特征图的空间分辨率却可以保持不变。...前两种结构是通过输出步长的设置，逐步缩小输出特征图的分辨率，从而使得每层特征上所对应的感受野的尺寸变化；第三种结构是通过直接改变每个卷积核的可见区域实现感受野变化；最后一个结构是通过对特征层进行不同尺度的池化...可以看到从block4到block7，通过应用不同比率的空洞卷积，该网络结构实现了在维持空间分辨率的前提下的感受野（尺度）变化。...为了克服这个问题，DeepLabv3中采用的做法是对最后一层特征图应用全局池化（global pooling），再将其送入一个1x1的卷积层中，最后，通过双线性上采样实现希望的空间分辨率。

8964 0

语义分割--Dilated Residual Networks 之转载

Dilated Convolutions的好处就是既能保持原有网络的感受野（Receptive Field），同时又不会损失图像空间的分辨率（224×224输入的最后卷积层输出特征map是28×28）。...但是我们可以看到，网络无需借助池化层也能增大后续网络的感受野。　　总结来说，Dilated Convolution可以不降低特征map的尺寸而增大卷积感受野。...实际上，我要指出，扩张卷积可以应用到任何CNN上，从而达到保护网络的空间分辨率。至于作者为什么应用和撰写将其扩展到残差网络，自然是因为残差网络是当前表现最好的网络之一。　　...但是最终特征map输出仅为7×7，最直接增加特征map分辨率的方法就是直接移除层间的subsampling（striding）操作，但是这样操作不能达到原网络每一层同一感受野，显然为了高分辨率而降低感受野是非常不可取的行为...这里就体现了扩张卷积的优点了，就是保持原有网络的感受野并且还能提高图片空间分辨率。

6753 0

为什么要用空洞卷积？

空洞卷积（atrous convolutions），又称扩张卷积（dilated convolutions），向卷积层引入了一个成为“扩张率（dilated rate）”的新参数，该参数定义了卷积核处理数据时各值的间距...在深度网络中为了增加感受野且降低计算量，总要进行降采样池化等，这样虽然可以增加感受野，但空间分辨率降低了。为了能不丢失分辨率，且仍然扩大感受野，可以使用空洞卷积。...所以总的来说，空洞卷积主要作用：不丢失分辨率的情况下扩大感受野调整扩张率获得多尺度信息不丢失分辨率的情况下扩大感受野：我们通过图例来看下空洞卷积是如何发挥作用的？...这就在不丢失特征分辨率的情况下扩大了感受野，进而对检测大物体有比较好的效果。调整扩张率获得多尺度信息：那么如何通过调整扩张率来获得多尺度信息呢？我们一起看下图： ?...所以，我们可以通过调整dilated rate大小，来调整卷积层的感受野，不同的感受野可以感受不同尺度信息的物体。 So, 你Get到了吗？

3.5K3 0

卷积神经网络（CNN）中感受野的计算问题

感受野在卷积神经网络中，感受野（Receptive Field）的定义是卷积神经网络每一层输出的特征图（feature map）上每个像素点在原始图像上映射的区域大小，这里的原始图像是指网络的输入图像...那么卷积神经网络的每一层感受野应该如何计算呢？很明显，深层卷积层的感受野大小和它之前所有层的滤波器大小和步长有关系，而涉及到这两个参数的有卷积层和pooling层。...我们用分别kn,sn,rn表示第n层的kernel_size，stride，receptive_field，通过对n-1层输出特征图的kn×kn个感受野为rn−1的特征单元卷积得到的n层输出特征单元最大的感受野为...对于卷积神经网络,其感受野计算有如下规律: 或者写为：另一种计算卷积核的方法——逆向法从当前层开始计算,慢慢往上计算: RF=(RF−1)∗stride kernelsize 如何增加感受野在深度学习中...总结一下共三种方法：增加pooling层，但是会降低准确性（pooling过程中造成了信息损失）增大卷积核的kernel size，但是会增加参数（卷积层的参数计算参考[2]）增加卷积层的个数，但是会面临梯度消失的问题

2190 0

【知识星球】卷积核和感受野可动态分配的分组卷积

基于Depthwise的分组卷积是一个非常有效的模型设计，不过它们通常是用同样大小的卷积核，MixNet则使用了可学习的多尺度卷积核提升其性能。...分组网络的不同分支可以拥有同样的感受野，也可以拥有不同的感受野，不过以往都是通过手动进行分配。然而不同的感受野对于不同的任务来说，应该有不同的重要性，ScaleNet就可以学习到不同的权重。...作者/编辑言有三网络结构如上，可以看到不同尺度在不同网络层的比例不同，整体结构与一般分组卷积无异。 ScaleNet具体的流程是： (1) 初始化，每个尺度的通道数量进行均匀分配。...(3) 根据BN层的缩放因子，在满足计算量的约束下，选择其中最重要的一些分支。 (4) 得到新的网络，重新训练该网络。作者们将这个结构替换掉ResNet中的基本单元，如下： ?...可以发现以更低的flops取得了更高的精度，下图展示了各个网络层的统计。 ? 可以看出，不同层所需的尺度比例，即对感受野的需求是不同的。

7922 0

重新思考空洞卷积 | RegSeg超越DeepLab、BiSeNetv2让语义分割实时+高精度

最近的一些进展解决了这个问题，方法是快速降低Backbone的分辨率，同时拥有一个或多个具有更高分辨率的平行分支。...作者采用了不同的方法，设计了一个受ResNeXt启发的Block结构，使用2个具有不同的膨胀率的并行3x3卷积层，以扩大感受野，同时保留局部细节。...Mobilenetv3的作者发现，将上一个卷积层的通道数量减半并不会降低语义分割的准确性，这暗示了ImageNet模型的通道冗余。...这两个问题启发作者设计一个专门用于语义分割的Backbone。作者通过引入一种称为“D Block”的新型膨胀结构，直接增加了Backbone中的感受野，并且可以让backbone中的通道数量降低。...DeepLabv3在ImageNet预训练的Backbone中使用空洞卷积，将输出stride减少到16或8，而不是通常的32，并通过提出Atrous空间金字塔池模块(ASPP)来增加感受野，该模块并行地应用了不同扩张率的卷积层分支

1.2K1 0

理解卷积神经网络中的四种卷积

对于size为3的卷积核，如果step为1，那么相邻步感受野之间就会有重复区域；如果step为2，那么相邻感受野不会重复，也不会有覆盖不到的地方；如果step为3，那么相邻步感受野之间会有一道大小为1颗像素的缝隙...使用3内核进行2D卷积，扩展率为2且无填充扩张卷积（Dilated Convolution）也被称为空洞卷积或者膨胀卷积，是在标准的卷积核中注入空洞，以此来增加模型的感受野（reception field...扩张的卷积为卷积层引入另一个参数，称为扩张率。这定义了卷积核中值之间的间距。扩张率为2的3x3内核与5x5内核具有相同的视野，而仅使用9个参数。...这就在不丢失特征分辨率的情况下扩大了感受野，进而对检测大物体有比较好的效果。所以总的来说，空洞卷积主要作用：不丢失分辨率的情况下扩大感受野；调整扩张率获得多尺度信息。...转置卷积从上面两个图可以看到，转置卷积和卷积有点类似，因为它产生与假设的反卷积层相同的空间分辨率。但是，对值执行的实际数学运算是不同的。转置卷积层执行常规卷积，但恢复其空间变换。

6575 0

CNN中常用的四种卷积详解

对于size为3的卷积核，如果step为1，那么相邻步感受野之间就会有重复区域；如果step为2，那么相邻感受野不会重复，也不会有覆盖不到的地方；如果step为3，那么相邻步感受野之间会有一道大小为1颗像素的缝隙...扩张卷积 [xbgfvq6xjb.gif] 使用3内核进行2D卷积，扩展率为2且无填充扩张卷积（Dilated Convolution）也被称为空洞卷积或者膨胀卷积，是在标准的卷积核中注入空洞，以此来增加模型的感受野...扩张的卷积为卷积层引入另一个参数，称为扩张率。这定义了卷积核中值之间的间距。扩张率为2的3x3内核与5x5内核具有相同的视野，而仅使用9个参数。...如之前的一篇文章： 为什么要用空洞卷积？...这就在不丢失特征分辨率的情况下扩大了感受野，进而对检测大物体有比较好的效果。所以总的来说，空洞卷积主要作用：不丢失分辨率的情况下扩大感受野；调整扩张率获得多尺度信息。

4.9K2 0

论文回顾：U2-Net，由U-Net组成的U-Net

浅层的输出特征图只包含局部特征，因为 1×1 或 3×3 卷积核的感受野太小，无法捕获全局信息。为了在浅层的高分辨率特征图中获得更多的全局信息，最直接的想法是扩大感受野，但这是以额外计算为代价的。...上图（d）显示了一个类似 Inception 的块，它试图通过使用扩张（空洞）卷积扩大感受野来提取局部和非局部特征。...但是以原始分辨率对输入特征图（尤其是早期阶段）进行多次扩张卷积需要过多的计算和内存资源。...较大的 L 会导致更深的残差 U 块 (RSU)、更多的池化操作、更大范围的感受野以及更丰富的局部和全局特征。配置 L 可以从具有任意空间分辨率的输入特征图中提取多尺度特征。...因此在 En_5 和 En_6 阶段，都使用了 RSU-4F，其中“F”表示 RSU 是扩张版本并且池化和上采样操作被扩张卷积取代。RSU-4F 的所有中间特征图都具有与其输入特征图相同的分辨率。

6023 0

论文回顾：U2-Net，由U-Net组成的U-Net

1.1K3 0

对深度可分离卷积、分组卷积、扩张卷积、转置卷积（反卷积）的理解

3 空洞（扩张）卷积（Dilated/Atrous Convolution）空洞卷积（dilated convolution）是针对图像语义分割问题中下采样会降低图像分辨率、丢失信息而提出的一种卷积思路...利用添加空洞扩大感受野，让原本3 x3的卷积核，在相同参数量和计算量下拥有5x5（dilated rate =2）或者更大的感受野，从而无需下采样。...在上图中扩张卷积的感受野可以由以下公式计算得到 ? ；其中i+1表示dilated rate。...上图是一个扩张率为2的3×3卷积核，感受野与5×5的卷积核相同，而且仅需要9个参数。你可以把它想象成一个5×5的卷积核，每隔一行或一列删除一行或一列。...在相同的计算条件下，空洞卷积提供了更大的感受野。空洞卷积经常用在实时图像分割中。当网络层需要较大的感受野，但计算资源有限而无法提高卷积核数量或大小时，可以考虑空洞卷积。

2.4K2 0

深度学习时代下的语义分割综述

5 扩张卷积 Dilated conv 对特征图进行下采样的一个好处是，给定相同的滤波器尺寸，其拓展了网络在输入上的感受野。考虑到这种方式比单纯增加滤波器尺寸更高效（参考这篇文章）。...然而，这种做法会导致空间分辨率的降低。扩张卷积提供了一种增加感受野但是又能保持空间分辨率的方法。具体如下图所示，其扩张的尺寸称为dilation rate。 ?...部分网络将最后几层pooling层替换成了dilation rates逐渐升高的扩张卷积层来实现尽量减少空间细节丢失的基础上增加感受野。...) l 应用全连接CRF Dilated卷积在不增加参数个数的基础上实现了感受野的增加。...扩张卷积的计算量巨大，且需要占用大量内存用于处理大量高分辨率的特征图。

2K2 0

对深度可分离卷积、分组卷积、扩张卷积、转置卷积（反卷积）的理解

3 空洞（扩张）卷积（Dilated/Atrous Convolution）空洞卷积（dilated convolution）是针对图像语义分割问题中下采样会降低图像分辨率、丢失信息而提出的一种卷积思路...利用添加空洞扩大感受野，让原本3 x3的卷积核，在相同参数量和计算量下拥有5×5（dilated rate =2）或者更大的感受野，从而无需下采样。...在上图中扩张卷积的感受野可以由以下公式计算得到；其中i+1表示dilated rate。...空洞卷积的动态过程在二维图像上直观地感受一下扩张卷积的过程：上图是一个扩张率为2的3×3卷积核，感受野与5×5的卷积核相同，而且仅需要9个参数。...当网络层需要较大的感受野，但计算资源有限而无法提高卷积核数量或大小时，可以考虑空洞卷积。

5392 0

DL | 语义分割原理与CNN架构变迁

这篇论文的作者提出将现有的、经过充分研究的图像分类网络（如 AlexNet）作为网络的编码模块，用转置卷积层作为解码模块，将粗略的特征图上采样至全分辨率的分割图。 ?...如下图所示，完整的网络是根据像素层面的交叉熵损失训练的。 ? 但因为编码模块将输入的分辨率降低了 32 倍，所以解码模块难以产生精细的分割图（如下图所示）。 ?...FC-DenseNet103 模型在 CamVid 数据集上得到了最好的结果扩张卷积（空洞卷积）对特征映射进行下采样的一个好处是在给定常量卷积核尺寸的情况下扩展了感受野（对于输入）。...由于大尺寸卷积核的参数效率较低（3.1 节所讨论），所以这种方法比增加卷积核尺寸更加合理。然而，这种扩展的代价是降低了空间分辨率。扩张卷积提供了另一种在保留完整空间维度的同时还能获得广泛视野的方法。...还有一些架构将最后几个池化层替换为具有连续增大扩张率的扩张卷积，这样可以在防止空间细节的丢失的同时保持相同的感受野。然而，要用扩张卷积完全替换池化层，计算成本还是很高。

1.2K3 0

如何理解扩张卷积（dilated convolution）

扩张卷积原理扩张卷积（Dilated Convolution）也被称为空洞卷积或者膨胀卷积，是在标准的卷积核中注入空洞，以此来增加模型的感受野（reception field）。...在图像输出网络后，Conv做特征的抽取，而Pooling做特征的聚合，并且让模型具有一定程度上的平移不变性，还可以降低后面卷积层的算力。最后到全连接层输出分类结果就好了。...；不做下采样，只增加卷积层的数量，首先会增大网络的计算量，其次不做Pooling的聚合最后的特征提取效果也会受到影响，而且感受野不会变化。...}RFi−1是上一层的感受野，kkk是卷积核的尺寸，sss是步长。...应用实例扩张卷积在图像分割领域使用是比较多的，因为本身扩张卷积的原文就用来做分割，此外，它在目标检测领域也有些应用，比如SSD，在新增的Conv6层卷积使用了dilation rate=6的卷积，为了进一步增大感受野

2.5K3 0

空洞卷积（AtrousDilated Convolution）

标准卷积可以看做空洞卷积rate=1（Note：rate=2表示中间空洞间隙为1）的特殊形式中间的空洞间隙，计算感受野的时候，也属于感受野的有效范围。...（单个卷积的感受野计算公式：[(rate-1)(k-1) + k] ** 2 ，其中(rate-1)(k-1) 是因为空洞而新增加的边长增量）作用：扩大感受野：原本为了增加感受野同时不增加计算量...空洞卷积可以在不需要引入额外参数的前提下，任意扩大感受野。一方面感受野大了可以检测分割大目标，另一方面分辨率高了可以精确定位目标。因此空洞卷积主要应用于检测、分割。...用法：语义分割由于需要获得较大的分辨率图，因此经常在网络的最后两个stage丢弃降采样操作，改用空洞卷积减少感受野的丢失。缺点：在实际中不好优化，且缺少对应的算子加速，速度会大大折扣。...因此存在gridding问题（网格效应/棋盘问题）：局部信息丢失：由于空洞卷积的计算方式类似于棋盘格式，某一层得到的卷积结果，来自上一层的独立的集合，没有相互依赖，因此该层的卷积结果之间没有相关性

1.2K2 0

深度学习基础入门篇：卷积算子：空洞卷积、分组卷积、可分离卷积、可变性卷积等详细讲解以及应用场景和应用实例剖析

空洞卷积通过引入扩张率（Dilation Rate）这一参数使得同样尺寸的卷积核获得更大的感受野。相应地，也可以使得在相同感受野大小的前提下，空洞卷积比普通卷积的参数量更少。...而空洞卷积与标准卷积相比，多了扩张率这一个参数，扩张率控制了卷积核中相邻元素间的距离，扩张率的改变可以控制卷积核感受野的大小。...图片图4 标准卷积的感受野示例其中，$3\times3$卷积对应的感受野大小就是$3\times3$，而通过两层$3\times3$的卷积之后，感受野的大小将会增加到$5\times5$。...图片图5 空洞卷积的感受野示例其中，通过一层空洞卷积后，感受野大小为$5\times5$，而通过两层空洞卷积后，感受野的大小将会增加到$9\times9$。...但对于视觉识别的传统CNN模块，不可避免的都存在固定几何结构的缺陷：卷积单元在固定位置对输入特征图进行采样；池化层以固定比率降低空间分辨率；一个ROI（感兴趣区域）池化层将一个ROI分割成固定的空间单元

1.5K4 3

深度 | 图像语义分割的工作原理和CNN架构变迁

图源：https://arxiv.org/abs/1411.4038 但因为编码模块将输入的分辨率降低了 32 倍，所以解码模块难以产生精细的分割图（如下图所示）。 ?...FC-DenseNet103 模型在 CamVid 数据集上得到了最好的结果（2017 年 10 月）扩张卷积（空洞卷积）对特征映射进行下采样的一个好处是在给定常量卷积核尺寸的情况下扩展了感受野（对于输入...由于大尺寸卷积核的参数效率较低（3.1 节所讨论），所以这种方法比增加卷积核尺寸更加合理。然而，这种扩展的代价是降低了空间分辨率。扩张卷积提供了另一种在保留完整空间维度的同时还能获得广泛视野的方法。...图源：https://github.com/vdumoulin/conv_arithmetic 还有一些架构将最后几个池化层替换为具有连续增大扩张率的扩张卷积，这样可以在防止空间细节的丢失的同时保持相同的感受野...然而，要用扩张卷积完全替换池化层，计算成本还是很高。损失加权方案由于密集预测的本质，我们在衡量损失加权时有很大的灵活性。

1.5K0 0

深度 | 图像语义分割的工作原理和CNN架构变迁

图源：https://arxiv.org/abs/1411.4038 但因为编码模块将输入的分辨率降低了 32 倍，所以解码模块难以产生精细的分割图（如下图所示）。...FC-DenseNet103 模型在 CamVid 数据集上得到了最好的结果（2017 年 10 月）扩张卷积（空洞卷积）对特征映射进行下采样的一个好处是在给定常量卷积核尺寸的情况下扩展了感受野（对于输入...由于大尺寸卷积核的参数效率较低（3.1 节所讨论），所以这种方法比增加卷积核尺寸更加合理。然而，这种扩展的代价是降低了空间分辨率。扩张卷积提供了另一种在保留完整空间维度的同时还能获得广泛视野的方法。...图源：https://github.com/vdumoulin/conv_arithmetic 还有一些架构将最后几个池化层替换为具有连续增大扩张率的扩张卷积，这样可以在防止空间细节的丢失的同时保持相同的感受野...然而，要用扩张卷积完全替换池化层，计算成本还是很高。损失加权方案由于密集预测的本质，我们在衡量损失加权时有很大的灵活性。

6421 0

详述Deep Learning中的各种卷积（二）

尽管所有这三个扩张卷积的卷积核都是同一尺寸，但模型的感受野却有很大的不同。时感受野为,时感受野为。时感受野为。值得注意的是，上述操作的参数量都是相同的。...扩张卷积在不增加计算成本的情况下，能让模型有更大的感受野（因为卷积核尺寸不变），这在多个扩张卷积彼此堆叠时尤其有效。...由此，**有效的感受野大小随层而指数增长，而参数的数量仅线性增长。**这篇论文中扩张卷积的作用是系统性地聚合多个比例的形境信息，而不丢失分辨率。...扩张卷积的应用主要讨论扩张卷积在语义分割（Semantic Segmentation)的应用一个的卷积层的正则等效于3个的卷积层的叠加。...如何同时处理不同大小的物体的关系（感受野粒度），则是设计好扩张卷积网络的关键。对于扩张卷积问题的处理，这里就不详述了。 6.4.

8992 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

为什么扩张的卷积层不会降低感受野的分辨率？

相关·内容

【分割模型解读】感受野与分辨率的控制术—空洞卷积

语义分割--Dilated Residual Networks 之转载

为什么要用空洞卷积？

卷积神经网络（CNN）中感受野的计算问题

【知识星球】卷积核和感受野可动态分配的分组卷积

重新思考空洞卷积 | RegSeg超越DeepLab、BiSeNetv2让语义分割实时+高精度

理解卷积神经网络中的四种卷积

CNN中常用的四种卷积详解

论文回顾：U2-Net，由U-Net组成的U-Net

论文回顾：U2-Net，由U-Net组成的U-Net

对深度可分离卷积、分组卷积、扩张卷积、转置卷积（反卷积）的理解

深度学习时代下的语义分割综述

对深度可分离卷积、分组卷积、扩张卷积、转置卷积（反卷积）的理解

DL | 语义分割原理与CNN架构变迁

如何理解扩张卷积（dilated convolution）

空洞卷积（AtrousDilated Convolution）

深度学习基础入门篇：卷积算子：空洞卷积、分组卷积、可分离卷积、可变性卷积等详细讲解以及应用场景和应用实例剖析

深度 | 图像语义分割的工作原理和CNN架构变迁

深度 | 图像语义分割的工作原理和CNN架构变迁

详述Deep Learning中的各种卷积（二）

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐