在Pytorch内置的自定义批处理规范中更新running_mean和running_var有问题吗？

pytorch

我从火炬视觉加载了一个预先训练过的Resnet152。我用相同的输入图像对模型进行多次评估，但每次输出是不同的。很奇怪。有人知道原因是什么吗？我的代码是import torchfrom PIL import

浏览 4提问于2022-05-24得票数 1

1回答

用BatchNorm进行放火枪的训练

deep-learning、pytorch

我想知道我是否需要做什么特别的训练时，用BatchNorm在火把。据我理解，gamma和beta参数按照优化器通常所做的那样用梯度更新。然而，批次的均值和方差是使用动量缓慢更新的。那么，当均值和方差参数被更新时，我们是否需要向优化器指定，还是py手电筒会自动处理这个问题？是否有方法访问BN层的均值和方差，以便在我训练模型时确保它正在改变。如果需要的话，这里是

浏览 1提问于2019-09-10得票数 3

回答已采纳

1回答

python-3.x、deep-learning、pytorch、batch-normalization、multi-gpu

我一直在尝试实现一个自定义的批量归一化功能，以便它可以扩展到多GPU版本，特别是，Pytorch.The自定义批处理规范中的DataParallel模块在使用1个GPU时工作正常，但当扩展到2个或更多时，运行均值和方差在前向函数中工作，但当它从网络返回时，均值和方差被重新初始化为0和1。torch.nn.DataParallel在</em

浏览 45提问于2020-04-20得票数 3

回答已采纳

1回答

为什么中只有一个动量参数？

keras、conv-neural-network、batch-normalization、momentum

我是CNN的新手，在CNN中使用keras实现Batchnorm。批处理规范层具有4*Feature_map( prev层)参数。具体情况如下： running_mean = momentum * running_mean + (1 - momentum) * sample_mean running

浏览 4提问于2021-01-05得票数 0

回答已采纳

1回答

BatchNorm2d的running_mean* / running_var在*PyTorch中意味着什么？

deep-learning、pytorch、mean、variance、batch-normalization

我想知道running_mean和running_var到底可以从nn.BatchNorm2d调用什么。]) 我无法理解running_mean和running_var在Pytorch官方文档

浏览 7提问于2022-07-07得票数 1

回答已采纳

2回答

register_parameter和register_buffer在PyTorch中有什么区别？

machine-learning、deep-learning、neural-network、pytorch

模块的在训练过程中被改变，也就是说，它们是在神经网络训练过程中学到的，但是什么是它是在神经网络训练过程中学习的吗？

浏览 0提问于2019-08-18得票数 26

1回答

为什么PyTorch* BatchNorm1D在规范整数类型张量的同时给出的"batch_norm“不是为‘长’错误实现的？*

python、machine-learning、deep-learning、pytorch、normalization

我试着学习Pytorch框架中的一些函数，在规范一个简单的整数张量时由于下面的错误而被困住了。有人能帮我解决这个问题吗。108 /opt/conda/lib/python3.7/site-packages/torch/nn/functional.py in batch_norm(input, running_mean, run

浏览 7提问于2022-11-28得票数 0

3回答

用同步装置和vars实现多GPU BN层的方法

tensorflow、caffe、torch、multi-gpu、batch-normalization

在使用多GPU进行培训时，我想知道用同步批处理统计信息实现批处理规范化层的可能方法。Tensorflow一般，它和咖啡豆<

浏览 3提问于2017-03-27得票数 12

1回答

使用Tensorflow对象检测API时，验证损失较高(使用训练数据集)，而训练损失较低

tensorflow、object-detection-api、tensorflow-model-garden

在使用model_main.py脚本运行更快的RCNN模型时，我故意将评估数据集设置为与训练数据集(TF_DATA)相同，并期望在评估中看到与训练中相同的损失。但是，评估损失(在4000个时期之后)：Loss/BoxClassifierLoss/localization_loss0.10792526 Loss/RPNLoss&#

浏览 13提问于2020-08-04得票数 1

1回答

基于特征的4D数据批处理规范化而不是通道(PyTorch)

python、machine-learning、neural-network、pytorch、batch-normalization

现在，在一维批处理规范化中，对整个批处理中的每个特性进行标准化；如果x^i_j是批中i^th样本输出的j^th特性，那么固定j的所有x^i_j都是规范化的(即选择单个特征，这将导致整个批处理中的标准高斯样本现在，对于2d批处理规范化，它似乎有点不同:对于整个批处理中<

浏览 3提问于2022-05-11得票数 0

3回答

增加批处理规范化会降低性能。

python、deep-learning、pytorch、batch-normalization

我正在使用PyTorch实现一个基于骨架的动作识别的分类网络。该模型由三个卷积层和两个完全连通的层组成。在NTU+D数据集中，这个基本模型给了我大约70%的精度.我想了解更多关于批处理规范化的知识，所以我为所有层添加了一个批处理规范化，除了最后一个层。令我惊讶的是，评估的准确率下降到60%，而不是增加，但训练的准确率却从80%提高到90%。有人能

浏览 1提问于2019-08-12得票数 4

回答已采纳

1回答

多个数据集的批规范化？

deep-learning、dataset、pytorch、data-augmentation、batch-normalization

我正在做一个生成合成数据的任务，以帮助我的模型的培训。这意味着训练是在合成+真实数据上进行的，并在真实数据上进行测试。我被告知，批量归一化层可能试图在训练时找到对所有人都有好处的权重，这是一个问题，因为我的合成数据的分布并不完全等于实际数据的分布。因此，我们的想法是拥有不同的批次归一化层的权重的“副本”。因此，神经网络可以对合成

浏览 0提问于2021-07-29得票数 0

2回答

ImageNet预训练的ResNet50骨干骨与TensorFlow不同

tensorflow、deep-learning、pytorch、resnet、pre-trained-model

，你可能会说.但我很难用随机初始化的差异来解释一个显著的差异。当然，这种差异被处理分类任务的密集层所吸收，但是:这

浏览 1提问于2021-05-03得票数 5

1回答

Numpy/PyTorch中的近邻差

python、numpy、pytorch

我需要一个在PyTorch中编写自定义丢失函数，但是由于PyTorch与NumPy的相似性，基于Numpy的解决方案也会工作。我有两个张量(Numpy数组) p和q of shape (b,...)。对于p中的每个批处理元素，我希望计算q的任何批处理元素的最小差值w.r.t。if tmp_loss<tmp_min:

浏览 10提问于2022-10-15得票数 0

回答已采纳

2回答

在PyTorch中实施培训

python、deep-learning、cnn、pytorch、yolo

我希望在PyTorch完成以下任务-1)我如何单独处理每个样本？我是否通过设置批处理大小= 1来进行此操作？或者禁用自动批处理有什么好处。如果是的话，我该怎么做。2)如何从dataset中准确地删除样本，以便进行进一步的

浏览 0提问于2020-05-26得票数 1

1回答

如何处理多个数据集的批量归一化？

python、pytorch、dataset、conv-neural-network、batch-normalization

我正在处理一项生成合成数据的任务，以帮助训练我的模型。这意味着训练是在合成+真实数据上执行的，并在真实数据上进行测试。有人告诉我，批量归一化层在训练时可能会试图找到对所有人都有利的权重，这是一个问题，因为我的合成数据的分布与实际数据的分布并不完全相等。因此，我们的想法是让批归一化层的权重有不同的“副本”。因此，神经网络为合成数据和</em

浏览 2提问于2021-08-27得票数 1

1回答

Keras多gpu批处理规范化

deep-learning、keras、tensorflow、batch-normalization

1)批处理规范化层是如何与多点_gpu_模型工作的？2)保存模型时，保存了哪些批规范化参数？(因为在Keras中使用多个gpus时，必须按照建议的这里保存原始模型)？具体而言，该功能实现了单机多GPU数据并行. 这对批处理标准化意味着什么？

浏览 0提问于2019-03-22得票数 3

2回答

在训练具有多个网络的类GAN图时，如何确保tf.control_dependencies()的正确行为？

python、tensorflow

我想我可以将这个问题总结为：“当我有两个唯一的网络时，我如何使用批处理标准化？” 我正在训练本质上是GAN的GAN，鉴别器和生成器都有Batch Norm层。这有点不同，因为与普通的GAN框架不同，这两个网络都有各自完全独立的损失函数。第二个网络基本上只是用来测量生成器在任务中的“错误程度”，但它们都应该完全独立地进行更新。我的网络都是在单独的G

浏览 2提问于2018-09-13得票数 0

1回答

为什么标准化会导致我的网络在训练中具有爆炸性的梯度？

python、tensorflow、image-processing、pytorch、autoencoder

我已经构建了一个网络(在Pytorch中)，它在图像恢复方面表现良好。我使用的是带有Resnet50编码器主干的自动编码器，然而，我只使用批量大小为1的编码器。我正在试验一些频域的东西，这些东西只允许我一次处理一幅图像。我发现我的网络运行得相当好，然而，只有当我从网络中删除所有批处理归一化时，它才能运行良好。当然，批处理规范对于批处理大小为1的

浏览 4提问于2021-06-25得票数 3

回答已采纳

1回答

使用带有自定义CUDA扩展的torch.nn.DataParallel

neural-network、deep-learning、pytorch、libtorch

据我所知，内置的PyTorch操作都通过隐式矢量化自动处理批处理，允许跨多个GPU并行。但是，当按照CUDA编写自定义操作时，给出的LLTM示例执行批处理不变的操作，例如按元素计算Sigmoid函数的梯度。但是，我有一个用例，它不是批处理元素不变的，也不是可向量化的。运行在单个GPU上的我目前(效率不高)循环处理批处理

浏览 1提问于2018-07-18得票数 37

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

相同的预训练模型具有相同的输入，多次运行会产生不同的输出。

用BatchNorm进行放火枪的训练