深度学习中的平均池化层和梯度伪影

、、、、

我知道在卷积层中，核的大小需要是步幅的倍数，否则它会在梯度计算中产生伪影，比如棋盘问题。现在，它在池化层中也是这样工作的吗？我在某处读到，最大池化也会导致类似的问题。以鉴别器中的这一行为例： self.downsample = nn.AvgPool2d(3, stride=2, padding=1, cou

浏览 30提问于2021-03-20得票数 1

1回答

卷积神经网络中如何学习汇聚层的梯度？

、

假设我们可以在训练神经网络时计算误差函数的layerwise Hessian，则池层的误差子面将是平坦的。？？没有权数需要学习，为汇集层，但为例。max池可以在不同的迭代中有不同的值吗？

浏览 0提问于2020-03-22得票数 1

回答已采纳

1回答

在CNN中使用全局和池代替全局平均池

、、、

我有一个CNN，它的基本结构如下，我拥有的网络是独立于输入大小的，所以我可以在不同大小的输入上使用它。但是，全局平均池操作使用输入大小来平均一个通道中的所有值。例如，如果我对图像进行零点处理以改变其输入大小，则在全局平均池之后得到一个不同的向量。，在将平均<

浏览 5提问于2021-08-20得票数 0

2回答

卷积神经网络中的反向传播

、、、

考虑具有以下结构的卷积神经网络：由于正向反传方程与softmax层完全连接，因此可以很容易地进行计算。 )因为我们使用的是平均池

浏览 4提问于2016-04-14得票数 5

1回答

关于深度学习快速入门(Knet.jl)的朱莉娅语言

、、

julia语言深度学习框架，这是Knet.jl，的快速入门using Knet, MLDatasets, IterTools复杂类型Conv有三个字段: w、b和fW矩阵和x矩阵的内积是用conv4 (c.w，x)计算的<

浏览 1提问于2021-02-10得票数 1

5回答

如何修复这些消失的渐变？

、、、、

我正试图为twitter情感分类培养一个深度网络。它由一个嵌入层(word2vec)、一个RNN层、2个conv层和2个密集层组成。对所有激活函数使用ReLU。我刚刚开始使用张力板&注意到我的卷积层重量似乎有极小的梯度(见图)。我相信我有消失的梯度，因为CNN过滤权重的分布似乎没有变化&相对于权重，梯度是非常小的</

浏览 0提问于2018-03-08得票数 5

1回答

如何用梯度下降从随机学习推广到批量学习？

、

我明白如何推导公式并实现深度神经网络的随机梯度下降(尽管隐层的总导数魔术有点超出了我的极限)。在随机反向传播中，大多数计算涉及到对神经元激活的误差的导数。但是在批量训练的情况下，每个训练示例有一个激活。你平均了

浏览 0提问于2018-08-22得票数 2

1回答

利用Tensorboard检测火炬中消失/爆炸梯度的最佳方法

、、

我怀疑我的Py手电筒模型已经消失了。我知道我可以跟踪每个层的梯度，并用writer.add_scalar或writer.add_histogram记录它们。但是，对于一个层数相对较多的模型，在TensorBoard日志中拥有所有这些直方图和图形就有点麻烦了。我不是说它不工作，只是有点不方便有不同的图表和直方图为每一层，并滚动它们。我正在寻找一个图，其中y轴(垂直)表示梯度值(特定层

浏览 1提问于2021-08-03得票数 2

1回答

卷积层的CNN反向传播

、、、、

我正在构建一个只有卷积层的CNN (到目前为止)。如何正确地支持Conv层？如果任何人有任何关于其他层的backprop<

浏览 1提问于2016-09-05得票数 1

1回答

为了对不同的框架进行基准测试，我想从头开始训练一个初始v3网络。下面是构建模型的代码片段： IMAGE_RES = 229model = tf.keras.applications.InceptionV3(include_topNone,classes=NUM_CLASSES) model.build(input_shape=(None, IMAGE_RES , IMAGE_RES , channels)) 根据keras官方网站的说法，参数weight=None意味着随机初始化。这是

浏览 15提问于2020-12-04得票数 0

回答已采纳

5回答

深度学习和传统的人工神经网络机器学习有什么区别？

、、、

你能简单地解释一下和传统机器学习之间的区别吗？要使一个神经网络变得“深”需要多少个层次？这都是市场炒作吗？

浏览 14提问于2016-04-12得票数 7

回答已采纳

2回答

机器学习模型，它有一个未定义的输入大小但有一个固定的输出？

、、

我对ML不太了解，但我似乎能想出如何训练这样的东西。如果你们能列举一些可行的方法，谢谢。

浏览 0提问于2020-04-29得票数 1

回答已采纳

1回答

卷积神经元网络体系结构的确定

、

卷积神经元网络体系结构的确定我读过很多关于神经元网络，反向传播，随机梯度下降，过度拟合，正则化等等的文章。有一些“难”的数学规则:这很容易理解。我想把这些植物分类：我研究了mnist数据库(手写数字数据库)的示例--为什么使用这些体系结构中的大多数示例:conv5x5 ->池(2，最大) -> Conv5x5？我已经绘制了第一个隐藏

浏览 2提问于2017-03-12得票数 0

回答已采纳

1回答

越来越大的正WGAN-GP损失

、、、、

我正在调查在PyTorch中使用具有梯度惩罚的Wasserstein GAN，但始终得到大的、正的发电机损失，并随着时间的推移而增加。我大量借鉴了，但我使用的是中使用的鉴别器和生成器损失，因为如果我尝试使用Caogang实现中使用的one和mone参数调用.backward()，就会得到Invalid gradient at index我在一个增强的WikiArt数据集(>400k 64x64

浏览 9提问于2018-11-26得票数 3

1回答

Tensorflow型微神经网络层的建立

、、

我试着在我的ESP32上运行一些ML，并且我想使用Tensorflow微。但我不太明白，它们是如何形成层层的。下面是如何训练人员检测模型的示例： micro_op_

浏览 1提问于2020-10-28得票数 0

回答已采纳

2回答

深度神经网络用于图像识别的精度，浮动还是双倍？

、、、

虽然在c++中通常是32位和 64位，但是它们在速度上并没有太大的差异，但是使用浮点数可以节省一些内存。有了一个神经网络，使用作为激活函数的是什么，如果我们能够选择神经网络中的哪些变量可以浮动，或者可以双倍浮动，以节省内存，而不使神经网络无法执行呢？虽然训练/测试数据的输入和输出肯定可以浮动，因为它们不需要双重精度，因为图像中的颜色只能在0-255的范围内，当标准化<em

浏览 1提问于2016-11-10得票数 6

1回答

为什么SELU激活函数保持为0？

、、

摘自Aurelien Geron的著作“与Scikit一起进行机器学习，Keras & Tensorflow"，第337页： “作者指出，如果建立一个完全由密集层组成的神经网络，并且所有隐藏层都使用SELU激活函数，则网络将自我规范化:每个层的输出将倾向于，在训练期间保持0的均值和1的标准差，从而解决了消失/爆炸梯度问题。我的问题是:

浏览 3提问于2020-04-05得票数 2

1回答

为什么在训练CNN时准确率不会提高？

、、

反过来，这些光谱图被转换成480x640x3矩阵(像素高度、像素宽度、RGB值)，这些矩阵又被分成三个重叠50%的第二段，得到大小为480x64x3的最终输入矩阵。我写的网络旨在复制这篇(https://arxiv.org/pdf/1802.09697.pdf)论文中描述的网络。该网络有八种类型可供学习，标记为0-7。在训练时，即使在几个时期之后，准确率仍然下降到0,125 (相当于纯猜测(1/8))。那么我到底做错了什么呢？verbose=0) pri

浏览 51提问于2019-04-28得票数 1

回答已采纳

1回答

为什么在构建卷积神经网络时，我们要在TensorFlow中创建一个由随机数组成的补丁？

、、

我正在复习TensorFlow教程，名为“面向专家的深度MNIST”(我希望对“专家”这个词的理解非常宽松！) initial = tf.truncated_normal(shape, stddev=0.1)它只输出截断正态分布的值在我看来，我只是把它看作是一个随机数的矩阵(ok，张量)。为了实际创建补丁，他们使用以下代码： W_conv1 = weight_var

浏览 1提问于2016-09-11得票数 0

1回答

车牌定位的垂直梯度计算

、、

我是新的MATLAB，并试图实现以下步骤的车牌定位：到目前为止，这是我的进展。1) - img(i,j) );end 输出：如果有人能指点我在这里做的错事，我会非常感激的。

浏览 5提问于2016-02-24得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

卷积神经网络中如何学习汇聚层的梯度？

在CNN中使用全局和池代替全局平均池

卷积神经网络中的反向传播

关于深度学习快速入门(Knet.jl)的朱莉娅语言

如何修复这些消失的渐变？

如何用梯度下降从随机学习推广到批量学习？

利用Tensorboard检测火炬中消失/爆炸梯度的最佳方法

卷积层的CNN反向传播

在tensorflow 2中从头开始训练keras应用程序

深度学习和传统的人工神经网络机器学习有什么区别？

机器学习模型，它有一个未定义的输入大小但有一个固定的输出？

卷积神经元网络体系结构的确定

越来越大的正WGAN-GP损失

Tensorflow型微神经网络层的建立

深度神经网络用于图像识别的精度，浮动还是双倍？

为什么SELU激活函数保持为0？

为什么在训练CNN时准确率不会提高？

为什么在构建卷积神经网络时，我们要在TensorFlow中创建一个由随机数组成的补丁？

车牌定位的垂直梯度计算

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐