开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >【pytorch】bn

【pytorch】bn

作者头像

JNingWei

发布于 2021-12-06 21:16:20

4950

发布于 2021-12-06 21:16:20

举报

文章被收录于专栏：JNing的专栏

bn接口定义：

 torch.nn.BatchNorm2d：
 def init(self,
 num_features,
 eps=1e-5,
 momentum=0.1,
 affine=True,
 track_running_stats=True)

args：

momentum：
- 默认为 0.1 。
- 要freeze的时候就设置为0.0（和 tf 里面是反着来的，tf是设置为1.0才能freeze）。
rack_running_stats：
- 计算running_mean和running_var（即moving_mean和moving_var）。
- 默认为True。
- 当设置为True时：
  - train 的时候用当前batch的mean和var，并更新running_mean和running_var。
  - eval 的时候用存储的running_mean和running_var，不会更新running_mean和running_var。
- 当设置为False时：
  - train 的时候用当前batch的mean和var，不会更新running_mean和running_var。
  - eval 的时候用当前batch的mean和var，不会更新running_mean和running_var。
  - 此时所有的 xx.xx.bn.running_mean、xx.xx.bn.running_var 和 xx.xx.bn.num_batches_tracked 都会被从 model.state_dict() 里面移除。（这三类缺失值可以从其他state_dict导入来补充）
- 具体参见《Pytorch的BatchNorm层使用中容易出现的问题》。
affine：
- 是否要“乘上缩放矩阵，加上平移向量”（也就是仿射矩阵）的开关。
- 默认为True。

Note：

即使对bn设置了 requires_grad = False ，一旦 model.train() ，bn还是会偷偷开启update（ model.eval()模式下就又停止update ）。

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2021/09/22 ，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

LV.

相关产品与服务

批量计算

批量计算（BatchCompute，Batch）是为有大数据计算业务的企业、科研单位等提供高性价比且易用的计算服务。批量计算 Batch 可以根据用户提供的批处理规模，智能地管理作业和调动其所需的最佳资源。有了 Batch 的帮助，您可以将精力集中在如何分析和处理数据结果上。