开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

什么时候使用膨胀卷积？

膨胀卷积（Dilated Convolution）是一种卷积神经网络中常用的操作，它在一些特定的场景下可以提供更好的性能和效果。以下是关于膨胀卷积的完善且全面的答案：

膨胀卷积是一种卷积操作，与传统的卷积操作相比，它在卷积核中引入了一个膨胀率（dilation rate）参数。膨胀率决定了卷积核中各个元素之间的间隔，从而影响了输出特征图的尺寸和感受野大小。

膨胀卷积的分类：

一维膨胀卷积：应用于序列数据（如文本、音频）处理中，可以捕捉到不同尺度的上下文信息。
二维膨胀卷积：应用于图像处理中，可以在保持特征图尺寸不变的情况下，增加感受野大小。

膨胀卷积的优势：

增大感受野：通过增加膨胀率，膨胀卷积可以扩大卷积核的有效感受野，从而更好地捕捉到输入数据中的长距离依赖关系。
减少参数量：相比于传统的卷积操作，膨胀卷积可以在保持感受野大小的同时，减少卷积核的参数量，降低模型复杂度。
保持特征图尺寸：在二维图像处理中，膨胀卷积可以在不改变特征图尺寸的情况下，增加感受野大小，提供更全局的上下文信息。

膨胀卷积的应用场景：

图像分割：膨胀卷积可以在保持分割结果细节的同时，增加感受野大小，提供更全局的上下文信息，有助于准确分割物体边界。
目标检测：膨胀卷积可以在保持感受野大小的同时，减少参数量，提高目标检测算法的效率和准确率。
语义分割：膨胀卷积可以捕捉到不同尺度的上下文信息，有助于准确预测像素级别的语义标签。

腾讯云相关产品和产品介绍链接地址：腾讯云提供了丰富的云计算服务和解决方案，以下是一些与膨胀卷积相关的产品和介绍链接地址（请注意，这里只是举例，实际上还有更多相关产品）：

腾讯云AI智能图像分析：https://cloud.tencent.com/product/tii
腾讯云AI智能视频分析：https://cloud.tencent.com/product/tva
腾讯云AI智能语音识别：https://cloud.tencent.com/product/asr
腾讯云AI智能语音合成：https://cloud.tencent.com/product/tts

以上是关于膨胀卷积的完善且全面的答案，希望能对您有所帮助。

相关搜索:tensorflow如何使用cudnn卷积？什么时候使用ChangeNotifier？什么时候使用embed？什么时候使用mmap，什么时候使用缓存层的读写？什么时候使用Private Sub，什么时候使用Public Sub？什么时候使用redux saga，什么时候使用redux thunk？什么时候使用Scala Futures？什么时候使用UaSubscription，什么时候使用ManagedSubscription，有什么区别？什么时候使用继承？什么时候对卷积层使用什么类型的填充？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

膨胀卷积

膨胀卷积是为解决语义分割任务而提出的。因为深度学习的蓬勃发展，其也被迁移应用于语义分割领域。当时的SOTA方法多是基于卷积神经网络，但卷积神经网络当初是为图像分类任务而设计的。语义分割作为一种稠密预测（Dense Prediction）任务——语义分割是像素级的分类任务，与图像分类具有结构上的不同。这里的不同指的应该是，图像分类的网络只需输出相应的物体类别的概率，而语义分割网络则需要输出与原图像大小相同的图像。

01

Python图像处理：图像腐蚀与图像膨胀

图像的膨胀（Dilation）和腐蚀（Erosion）是两种基本的形态学运算，主要用来寻找图像中的极大区域和极小区域。其中膨胀类似于“领域扩张”，将图像中的高亮区域或白色部分进行扩张，其运行结果图比原图的高亮区域更大；腐蚀类似于“领域被蚕食”，将图像中的高亮区域或白色部分进行缩减细化，其运行结果图比原图的高亮区域更小。

02

[Python图像处理] 八.图像腐蚀与图像膨胀

该系列文章是讲解Python OpenCV图像处理知识，前期主要讲解图像入门、OpenCV基础用法，中期讲解图像处理的各种算法，包括图像锐化算子、图像增强技术、图像分割等，后期结合深度学习研究图像识别、图像分类、目标检测应用。

02

《DeepLab V2》论文阅读

昨天的推文《DeepLab V2》组织方式很不清晰，没有将关键结论以及空洞卷积这种方法的优点讲出来，所以重新组织了一下这篇论文的解读，希望可以带来不一样的体验。

02

高精度目标检测算法-RFBNet

当前顶级目标检测器依赖于非常深的CNN主干网络，例如ResNet-101和Inception，优点是它们具有强大的特征表现能力，但是耗时严重。相反地，一些基于轻量级模型的检测器满足实时处理，但是精度是诟病。

02

计算机视觉 OpenCV Android | 图像操作之自定义滤波、形态学操作（更新ing）

其中，左侧是Robert算子的X方向梯度、右侧是Y方向梯度。自定义Robert算子实现如下：

03

目标检测算法之ICCV 2019 TridentNet（三叉戟网络，刷新COCO纪录，已开源）

今天为大家介绍一篇图森科技在ICCV 2019的目标检测论文《Scale-Aware Trident Networks for Object Detection》，简称TridentNet，中文翻译为三叉戟网络。论文地址见附录。

03

CVPR 2020丨ADSCNet: 自纠正自适应膨胀率计数网络解读

编者按：在CVPR 2020上，商汤团队提出的自纠正自适应膨胀率计数网络，针对计数任务中点标注位置不一致和透视现象造成巨大的尺度变化的问题提出了有效的网络设计和监督方法。在监督方式方面，ADSCNet利用网络学习的结果来纠正不一致的人工标注从而更有效的训练；在网络设计方面，ADSCNet提出自适应膨胀率的卷积结构，不同位置采用不同的膨胀率来适应尺度的变化。ADSCNet在四个公开数据集上均有显著的提升。

01

图像腐蚀与图像膨胀在信号过滤的应用

图像的膨胀(dilation)和腐蚀(erosion)是两种基本的形态学运算,主要用来寻找图像中的极大区域和极小区域.

02

【OpenCV】Chapter8.形态学图像处理

形态学的基本思想是利用结构元素测量或提取输入图像中的形状或特征，以便进行图像分析和目标识别。

02

ICCV 2019 Oral论文：KAUST提出大幅加深图卷积网络的新方法

论文作者：Guohao Li, Matthias Müller, Ali Thabet, Bernard Ghanem

03

【TS深度学习】时间卷积神经网络

在深度学习的知识宝库中，除了前面文章中介绍的RNN，还有一个重要的分支：卷积神经网络（CNN），其广泛应用于视觉，视频等二维或者多维的图像领域。卷积网络具有深度，可并行等多种特性，这种技术是否可以应用于解单维度的时间序列问题呢？本文介绍一种最近提出的新技术：时间卷积神经网络 (Temporal Convolutional Network，TCN)，由Lea等人于2016年首次提出，起初应用于视频里动作的分割，后逐渐拓展到了一般性时序领域。

01

转置卷积详解

前面文章对卷积做了讲解，感觉既然重新整理，就将系列概念整体做个梳理，也算是将自己知道的所有东西拿来献丑把。转置卷积(Transposed Convolution)是后来的叫法，一开始大家都是称逆卷积/反卷积(Deconvolution)，这个概念是在图像分割任务中被提出来的，图像分割需要逐像素的操作，对每一个像素做一个分割，将其归类到不同的物体当中。这个任务大家很自然的想要使用卷积神经网络来完成，那就得先使用卷积神经网络提取特征，但是卷积神经网络中的两大主要构件，卷积层和下采样层会使得图像的尺寸不断缩小。这个就与逐像素的分类不符，因为逐像素分割的话是需要输出和输入大小是一致的。针对这个问题，有人提出了先使用卷积核下采样层逐层的提取特征，然后通过上采样再将特征图逐渐的恢复到原图的尺寸。而这个上采样一开始就是通过反卷积来实现的。如果说卷积核下采样的过程特征图是变小的，那么上采样之后特征图应该变大。我们应该熟悉卷积的输出尺寸公式 o u t = ( F − K + 2 P ) / s + 1 out=(F-K+2P)/s+1 out=(F−K+2P)/s+1，其中F表示输入特征图的尺寸，K表示卷积核的尺寸，P表示padding，S表示卷积的步长。我们都通过这个公式来计算卷积的输出特征图尺寸。举例来说明，一个4×4的输入特征图，卷积核为3×3，如果不使用paddng，步长为1，则带入计算 o u t = ( 4 − 3 ) / 1 + 1 out=(4-3)/1+1 out=(4−3)/1+1为2。我们已经在im2col算法的介绍中讲解了卷积的实现，实际上这个步骤是通过两个矩阵的乘法来完成的，我们不妨记为 y = C x y=Cx y=Cx，如果要上采样，我们希望给输出特征图乘一个参数矩阵，然后把尺寸还原回去，根据数学知识，我们给特征图矩阵 y y y左乘一个{C^T}，就能得到 C T y = C T C x C^Ty=C^TCx CTy=CTCx， C C C的列数等于 x x x的行数， C T C C^TC CTC的行数和列数都等于x的行数，乘完之后，得到的结果与 x x x形状相同。这就是转置卷积名字的来源。有一些工作确实是这样实现的。我们也能很自然的得出结论，我们不需要给输出特征图左乘 C T C^T CT，显然只要和这个矩阵形状相同，输出的结果就和原特征图尺寸相同，而且这个操作同样可以使用卷积来实现，那我们只要保证形状一致，然后参数我们可以自己训练，这样尺寸的问题解决了，而且特征的对应也有了，是可以训练的，一举两得。 im2col讲解的内容，卷积是 ( C o u t , C i n ∗ K h ∗ K w ) (C_{out},C_{in}*K_h*K_w) (Cout,Cin∗Kh∗Kw)的卷积核乘 ( C i n ∗ K h ∗ K w , H N ∗ W N ) (C_{in}*K_h*K_w,H_N*W_N) (Cin∗Kh∗Kw,HN∗WN)的特征图，得到 ( C o u t , H N ∗ W N ) (C_{out},H_N*W_N) (Cout,HN∗WN)的结果。现在对卷积核做一个转置 ( C i n ∗ K h ∗ K w , C o u t ) (C_{in}*K_h*K_w,C_{out}) (Cin∗Kh∗Kw,Cout)乘 ( C o u t , H N ∗ W N ) (C_{out},H_N*W_N) (Cout,HN∗WN)得到一个 ( C i n ∗ K h ∗ K w , H N ∗ W N ) (C_{in}*K_h*K_w,H_N*W_N) (Cin∗Kh∗Kw,HN∗WN)的特征图。除了以上内容这里还有一点其他需要补充的东西，比如在caffe中除了im2col函数之外，还有一个函数是col2im，也就是im2col的逆运算。所以对于上面的结果caffe是通过col2im来转换成特征图的。但是col2im函数对于im2col只是形状上的逆函数，事实上，如果对于一个特征图先执行im2col再执行col2im得到的结果和原来是不相等的。而在tensorflow和pytorch中，这一点是有差异的，两者是基于特征图膨胀实现的转置卷积操作，两者是是通过填充来进行特征图膨胀的，之后可能还会有一个crop操作。之所以需要填充，是因为想要直接通过卷积操作来实现转置卷积，干脆填充一些值，这样卷积出来的特征图尺寸自然就更大。但是两者从运算上来讲都无法对原卷积进行复原，只是进行了形状复原而已。到了最后就可以讨论形状的计算了，转置卷积是卷积的形状逆操作，所以形状计算就是原来计算方式的逆函数。 o u t = ( F − K + 2 P ) / s + 1 out

02

opencv 图像腐蚀和图像膨胀的实现

如图，使用图像腐蚀进行去噪，但是为压缩噪声。对腐蚀过的图像，进行膨胀处理，可以去除噪声，并保持原样形状。

02

【NLP-NER】命名实体识别中最常用的两种深度学习模型

命名实体识别（Named Entity Recognition，NER）是NLP中一项非常基础的任务。NER是信息提取、问答系统、句法分析、机器翻译等众多NLP任务的重要基础工具。

02

重新思考空洞卷积 | RegSeg超越DeepLab、BiSeNetv2让语义分割实时+高精度

语义分割是对输入图像中的每个像素进行分类的任务。它的应用包括自动驾驶、自然场景理解和机器人技术。它也是全景分割方法的基础，该方法除了为每个像素分配一个类之外，还分离同一类的实例。

01

用于实时MRI脑部肿瘤分割的3D膨胀多纤维网络

Authors: Chen Chen, Xiaopeng Liu, Meng Ding, Junfeng Zheng, Jiangyun Li Code：https://github.com/China-LiuXiaopeng/BraTS-DMFNet

03

从 MaxViT 到 ACC-ViT：视觉 Transformer 的紧凑型网络实现参数与性能的双重优化！

早期的视觉 Transformer （ViT）探索了利用文本 Transformer 的看似无限可扩展性[9]来处理图像的可行性，但由于缺乏足够的感应偏置，且没有进行任何视觉特定的调整[27]，因此它们无法达到当时最先进的CNN模型[10]的水平。那些早期的ViT忽视了一个特别重要的方面，即局部模式，这些模式通常携带强烈的上下文信息[17]。这导致了Swin Transformer [18]提出的窗口注意力的发展，这是第一个真正有竞争力的视觉 Transformer 模型。

01

论文阅读: 1705.DRN

1705.09914：Dilated Residual Networks 使用扩张卷积替换模型中的下采样，保持feature map的空间分辨率同时不降低后续卷积层的接收野的分辨率，实验证明这样简单转换是有效的： DRN结构没有了resnet最后的两次下采样，也就是说，特征图在28x28的大小之后就不再变小了。不再减小特征图尺寸，那么就要增加卷积核的膨胀系数。可以看到，DRN没有后两次下采样（在本该第四次采样的卷积过程中将膨胀系数改成2，在本该第五次采样的卷积过程中将膨胀系数改成4，均能保持相同的视野域

03

【目标分割】开源 | D2Conv3D：应用动态扩展卷积进行目标分割，可以提高多种3D CNN架构在多个视频分割基准上的性能

论文地址： http://arxiv.org/pdf/2111.07774v1.pdf

01

[Python图像处理] 九.形态学之图像开运算、闭运算、梯度运算

该系列文章是讲解Python OpenCV图像处理知识，前期主要讲解图像入门、OpenCV基础用法，中期讲解图像处理的各种算法，包括图像锐化算子、图像增强技术、图像分割等，后期结合深度学习研究图像识别、图像分类、目标检测应用。

02

matlab | 二值形态学处理

图像的二值形态学处理，是利用集合论的思想，能够简化图像数据，保持基本形状特征，除去不相干的结构，此外还能并行实现。

02

opencv 形态学变换(开运算，闭运算，梯度运算)

形态学里把腐蚀和膨胀单独拿了出来，其他操作（保括膨胀和腐蚀的组合操作）都叫形态学变换。 opencv里有包：cv2.morphologyEx() morphology ：译文形态学使用python +opencv讲解

02

图像的膨胀与腐蚀——OpenCV与C++的具体实现

膨胀与腐蚀是数学形态学在图像处理中最基础的操作。在笔者之前的文章《图像的卷积(滤波)运算(一)——图像梯度》、《图像的卷积(滤波)运算(二)——高斯滤波》具体介绍了图像卷积\滤波的具体的概念与操作，图像的膨胀与腐蚀其实也是一种类似的卷积操作。其卷积操作非常简单，对于图像的每个像素，取其一定的邻域，计算最大值/最小值作为新图像对应像素位置的像素值。其中，取最大值就是膨胀，取最小值就是腐蚀。

02

【OpenCV入门十七讲】形态学操作

学习计算机视觉最重要的能力应该就是编程了，为了帮助小伙伴尽快入门计算机视觉，小白准备了【OpenCV入门】系列。新的一年文章的内容进行了很大的完善，主要是借鉴了更多大神的文章，希望让小伙伴更加容易理解。如果小伙伴觉得有帮助，请点击一下文末的“在看”鼓励一下小白。

02

分割算法——可以分割一切目标（各种分割总结）

周末应该是一个好好休息的时间，但是一定会有在默默努力科研的你，由于最近是开学季，很多关注的朋友一直会问“计算机视觉战队平台有基础性的内容吗？”，今天我和大家说一次，我们平台之前有推送很多基础的知识，有兴趣的或者是刚刚接触CV&DL的你，可以去历史消息阅读，在这也感谢所有一直关注和支持我们的您！

04

用opencv给图片换背景色的示例代码

OpenCV函数：cv2.blur(), cv2.GaussianBlur(), cv2.medianBlur(), cv2.bilateralFilter()

03

【走进OpenCV】这样腐蚀下来让我膨胀！

学习计算机视觉最重要的能力应该就是编程了，为了帮助小伙伴尽快入门计算机视觉，小白准备了【走进OpenCV】系列，主要帮助小伙伴了解如何调用OpenCV库，涉及到的知识点会做简单讲解。

01

ESPNet: 自动驾驶领域轻量级分割模型

原文：ESPNet: Efficient Spatial Pyramid of Dilated Convolutions for Semantic Segmentation

01

opencv 2 -- 形态学处理

一、图像腐蚀图像腐蚀：卷积核沿着图像滑动，如果与卷积核对应的原图像的所有像素值都是 1，那么中心元素就保持原来的像素值，否则就变为零。

01

时域卷积网络TCN详解：使用卷积进行序列建模和预测

尽管卷积神经网络(CNNs)通常与图像分类任务相关，但经过适当的修改，它已被证明是进行序列建模和预测的有价值的工具。在本文中，我们将详细探讨时域卷积网络(TCN)所包含的基本构建块，以及它们如何结合在一起创建一个强大的预测模型。使用我们的开源Darts TCN实现，我们展示了只用几行代码就可以在真实数据集上实现准确预测。

05

常用图像处理算法（）[通俗易懂]

表1 图像处理操作按处理对象数量分类表格

02

LSTM的备胎，用卷积处理时间序列——TCN与因果卷积（理论+Python实践）

TCN全称Temporal Convolutional Network，时序卷积网络，是在2018年提出的一个卷积模型，但是可以用来处理时间序列。

04

卷积神经网络是如何实现不变性特征提取的

传统的图像特征提取（特征工程）主要是基于各种先验模型，通过提取图像关键点、生成描述子特征数据、进行数据匹配或者机器学习方法对特征数据二分类/多分类实现图像的对象检测与识别。卷积神经网络通过计算机自动提取特征（表示工程）实现图像特征的提取与抽象，通过MLP实现数据的回归与分类。二者提取的特征数据都具不变性特征。

02

一文详解Inception家族的前世今生（从InceptionV1-V4、Xception）附全部代码实现

【导读】今天将主要介绍Inception的家族及其前世今生.Inception 网络是 CNN 发展史上一个重要的里程碑。在 Inception 出现之前，大部分 CNN 仅仅是把卷积层堆叠得越来越多，使网络越来越深，以此希望能够得到更好的性能。而Inception则是从网络的堆叠结构出发，提出了多条并行分支结构的思想，后续一系列的多分支网络结构均从此而来。总体来说，Inception系列网络在结构上相对比较复杂，工程性较强，而且其中通常使用很多tricks来提升网络的综合性能（准确率和速度）。目前Inception系列具体网络结构包括：

03

【AI有识境】如何掌握好图像分割算法？值得你看的技术综述

进入到有识境界，可以大胆地说自己是一个非常合格的深度学习算法工程师了，能够敏锐地把握自己研究的领域，跟踪前沿和能落地的技术，对自己暂时不熟悉的领域也能快速地触类旁通。

02

opencv 1-- getStructuringElement函数

需要输入两个参数：一个是原始图像，一个被称为结构化元素或核，它是用来决定操作的性质的

03

特定领域知识图谱融合方案：文本匹配算法(Simnet、Simcse、Diffcse)

特定领域知识图谱融合方案：文本匹配算法(Simnet、Simcse、Diffcse) 本项目链接：https://aistudio.baidu.com/aistudio/projectdetail/5

03

深入卷积神经网络：高级卷积层原理和计算的可视化

在深度计算机视觉领域中，有几种类型的卷积层与我们经常使用的原始卷积层不同。在计算机视觉的深度学习研究方面，许多流行的高级卷积神经网络实现都使用了这些层。这些层中的每一层都有不同于原始卷积层的机制，这使得每种类型的层都有一个特别特殊的功能。

02

可变形卷积系列(一) 打破常规，MSRA提出DCNv1 | ICCV 2017 Oral

常规卷积操作的感受域是固定的，但不同大小的目标应该需要不同大小的感受域，甚至是不规则的感受域。为此，论文提出两个模块来使CNN具备几何变换的建模能力：

03

OpenCV图像处理笔记（二）：图片操作进阶

一、图像模糊 1、模糊原理 Smooth/Blur 是图像处理中最简单和常用的操作之一使用该操作的原因之一就为了给图像预处理时候减低噪声使用Smooth/Blur操作其背后是数学的卷积计算通常这

02

深度学习500问——Chapter08：目标检测（3）

DetNet是发表在ECCV2018的论文，出发点是现有的检测任务backbone都是从分类任务衍生而来的，因此作者想针对检测专用的backbone做一些讨论和研究而设计了DetNet，思路比较新奇。

01

论文解读 Receptive Field Block Net for Accurate and Fast

Receptive Field Block Net for Accurate and Fast ... 【ECCV 2018】

02

DeepLab系列学习

DeepLab系列在2015年的ICLR上被提出，主要是使用DCNNs和概率图模型（条件随机场）来实现图像像素级的分类（语义分割任务）。DCNN应用于像素级分类任务有两大障碍：信号下采样和空间“不敏感性”（不变性）。由于DCNNs的平移不变性，DCNNs被用到很多抽象的图像任务中，如imagenet大规模分类，coco目标检测等中。第一个问题涉及在每层DCNN上执行的最大池化和下采样（‘步长’）的重复组合所引起的信号分辨率的降，此模型通过使用空洞算法（”hole” algorithm，也叫”atrous” algorithm）来改进第一个问题，通过使用全连接条件随机场来改善分割效果。总结DeepLabV1又三个优点: （1）速度快，带空洞卷积的DCNN可以达到8fps，而后处理的全连接CRF只需要0.5s。（2）准确性高：在PASCAL VOC取得第一名的成绩，高于第二名7.2%个点，在PASCAL VOC-2012测试集上达到71.6%的IOU准确性。（3）简单：有两个模块构成整体模型，分别是DCNN和CRF

03

【深度学习】图像语义分割

语义分割(Semantic Segmentation)是图像处理和机器视觉一个重要分支，其目标是精确理解图像场景与内容。语义分割是在像素级别上的分类，属于同一类的像素都要被归为一类，因此语义分割是从像素级别来理解图像的。如下如所示的照片，属于人的像素部分划分成一类，属于摩托车的像素划分成一类，背景像素划分为一类。

04

OpenCV与图像处理（三）

以下代码均在python3.6，opencv4.2.0环境下试了跑一遍，可直接运行。

02

深度学习图语义分割的综述

图像分割是计算机视觉和机器学习领域发展最快的领域之一，包括分类、分类与定位、目标检测、语义分割、实例分割和Panoptic分割。

01

形态学滤波（一）之概述

定义：数学形态学是以形态结构元素为基础对图像进行分析的数学工具。它的基本思想是，用具有一定形态的结构元素度量和提取图像中的对应形状，以达到对图像分析和识别的目的。数学形态学的基本运算有4个：膨胀、腐蚀、开运算和闭运算。 1.膨胀（dilate）求局部最大值的操作。从数学角度上讲，膨胀和腐蚀就是将图像与核进行卷积的一个过程。 2.腐蚀（erode）求局部最小值。可以预见的是腐蚀过后的图像将会拥有比原图更小的高亮区域，亮度会有所下降。同时，腐蚀操作还会连通相邻比较暗的区域。 3.开运算（openin

08

OpenCV 滤波与卷积之 —— 形态学操作

OpenCV 还提供了一种高效且易用的图像形态学变换接口。图像形态学有其特定的发展领域，特别是在计算机视觉发展早期，已经发展出了很多的形态学方法。大部分都是为某个特定目的而产生的，其中一些更是沿用了很长一段时间。基本上，所有的形态学操作都基于两种原始操作，接下来的讲述也将以这两点开始，循序渐进发展到更加复杂的操作，每个更加复杂的操作都将通过前面的方法来表示。

01

opencv 图像礼帽和图像黑帽的实现

图像礼帽也叫图像顶帽礼帽图像=原始图像-开运算图像得到噪声图像开运算：先腐蚀再膨胀

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭