开源框架MXNet | 环境变量配置(显存)

一般情况下,不需要修改有关环境变量的配置。但是一些特殊情况,需要修改的,就涉及到以下这些内容了: 在linux上最简单的修改方式就是export MXNET_GPU_WORKER_NTHREADS=3

一 设置进程数量

  • MXNET_GPU_WORKER_NTHREADS 这个参数用来在一块卡上并行计算,在每一块GPU上最大的进程数,默认值为2
  • MXNET_GPU_COPY_NTHREADS 在每个GPU上执行内存复制作业的并发线程的最大数量,默认值1
  • MXNET_CPU_WORKER_NTHREADS
  • MXNET_CPU_PRIORITY_NTHREADS
  • MXNET_CPU_NNPACK_NTHREADS

二 显存选项

  • MXNET_EXEC_ENABLE_INPLACE 默认值:true
  • NNVM_EXEC_MATCH_RANGE 默认值:16
  • MXNET_EXEC_NUM_TEMP 默认值:1 将此设置为一个小数目可以节省GPU内存。它也可能会降低并行度,这通常是可以接受的。
  • MXNET_GPU_MEM_POOL_RESERVE 默认值:5 If you see a strange out-of-memory error from the kernel launch, after multiple iterations, try setting this to a larger value.

三 Memonger

  • MXNET_BACKWARD_DO_MIRROR 默认值:0,可选0或1 MXNet 使用镜像概念来节省内存。用于训练阶段来节省设备内存,当设置为1 的时候,在前向传播的时候会复制某些层的fp,反向传播的时候会重新计算这些数据。 MXNET_BACKWARD_DO_MIRROR=1 将会节省30%~50%的显存, 保存95%的运行速度。

四 控制数据通信

  • MXNET_KVSTORE_REDUCTION_NTHREADS 默认值:4 用于总结大数组的CPU线程数。
  • MXNET_KVSTORE_BIGARRAY_BOUND
  • MXNET_ENABLE_GPU_P2P

更多配置信息:

http://mxnet.incubator.apache.org/how_to/env_var.html

五 Mxnet恢复训练

Mxnet可以通过断点恢复训练,命令如下:

python train_end2end.py --network resnet --gpu 0 --resume --begin_epoch 10 --end_epoch 15 --lr_step 15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏DannyHoo的专栏

iOS开发中利用runtime为某个类的category增加属性

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u010105969/article/details/...

783
来自专栏草根专栏

使用xUnit为.net core程序进行单元测试(下1)

第1部分: https://cloud.tencent.com/developer/article/1019835

3546
来自专栏Python中文社区

Keras 的 Web 填坑记

博客主页:https://www.zhihu.com/people/tu-dou-dou-27-10

1133
来自专栏ITCloud的专栏

Pike版本变慢,不慌,看云计算十年老兵教你一招化解

1233
来自专栏Y大宽

RNA-seq分析简洁版

Tumor:SRR316214,SRR316215 Adjacent Normal Liver:SRR316212,SRR316213

772
来自专栏Web 开发

宏基4535-651G25Mn

中规中矩的配置,运行WIN7应该没有问题,便便今晚的装WIN 7后,时不时会卡,并且不是一般的卡,放首歌都会卡

701
来自专栏陈满iOS

[iOS学习笔记]·第三方网络图片处理框架:SDWebImage(官方文档翻译篇)

该库提供了具有缓存支持的异步图像下载器。为方便起见,我们为UI元素例如UIImageView,UIButton,MKAnnotationView等类添加了cat...

982
来自专栏生信技能树

单细胞转录组3大R包之Seurat

牛津大学的Rahul Satija等开发的Seurat,最早公布在Nature biotechnology, 2015,文章是; Spatial reconst...

2.2K19
来自专栏FreeBuf

如何“爆破检测”加密密码字段和存在验证码的Web系统

*本文原创作者:shystartree,本文属FreeBuf原创奖励计划,未经许可禁止转载

802
来自专栏WOLFRAM

用 Wolfram 语言绘制电子轨道

1295

扫码关注云+社区