文章/答案/技术大牛

发布

社区首页 >问答首页 >Pytorch running_mean、running_var和num_batches_tracked在培训期间更新，但我想修复它们。

问Pytorch running_mean、running_var和num_batches_tracked在培训期间更新，但我想修复它们。
EN

Stack Overflow用户

提问于 2021-12-07 12:10:17

回答 1查看 670关注 0票数 1

在pytorch中，我想使用预先训练的模型并训练我的模型来向模型结果中添加一个增量，即：

        ╭----- (pretrained model) ------ result ---╮
 input------------- (my model) --------- Δresult --+-- final_result

以下是我所做的：

用load_state_dict加载预训练模型的参数
设置所有预训练模型的参数requires_grad = False
创建我的模型并开始训练

但经过训练后，当我检查result (预训练模型的输出)时，发现它与原始预训练模型的输出不匹配。我仔细比较了预训练模型的参数，唯一的变化是BatchNorm2d的running_mean、running_var和num_batches_tracked (因为我设置了所有预训练模型的参数requires_grad = False)，当我将这三个参数改为原始的参数时，result匹配原始预训练模型的输出。

我不想改变预先训练过的模式。那么有什么方法可以修复running_mean、running_var和num_batches_tracked呢？

python

pytorch

pre-trained-model

batch-normalization

回答 1

Stack Overflow用户

发布于 2021-12-07 23:11:39

我偶然发现了同样的问题，因此我调整了这个回购中的上下文管理器，如下所示：

@contextlib.contextmanager
def _disable_tracking_bn_stats(self):
    def switch_attr():
        if not hasattr(self, 'running_stats_modules'):
            self.running_stats_modules = \
                [mod for n, mod in self.model.named_modules() if
                 hasattr(mod, 'track_running_stats')]

        for mod in self.running_stats_modules:
            mod.track_running_stats ^= True

    switch_attr()
    yield
    switch_attr()

作为另一种选择，我认为通过在eval模块上调用BatchNorm可以获得类似的结果：

for layer in net.modules():
    if isinstance(layer, BatchNorm2d):
        layer.eval()

虽然第一种方法更有原则。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/70259900

复制

相似问题

问Pytorch running_mean、running_var和num_batches_tracked在培训期间更新，但我想修复它们。
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Pytorch running_mean、running_var和num_batches_tracked在培训期间更新，但我想修复它们。EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Pytorch running_mean、running_var和num_batches_tracked在培训期间更新，但我想修复它们。
EN