开源框架MXNet | 环境变量配置(显存)

一般情况下,不需要修改有关环境变量的配置。但是一些特殊情况,需要修改的,就涉及到以下这些内容了: 在linux上最简单的修改方式就是export MXNET_GPU_WORKER_NTHREADS=3

一 设置进程数量

  • MXNET_GPU_WORKER_NTHREADS 这个参数用来在一块卡上并行计算,在每一块GPU上最大的进程数,默认值为2
  • MXNET_GPU_COPY_NTHREADS 在每个GPU上执行内存复制作业的并发线程的最大数量,默认值1
  • MXNET_CPU_WORKER_NTHREADS
  • MXNET_CPU_PRIORITY_NTHREADS
  • MXNET_CPU_NNPACK_NTHREADS

二 显存选项

  • MXNET_EXEC_ENABLE_INPLACE 默认值:true
  • NNVM_EXEC_MATCH_RANGE 默认值:16
  • MXNET_EXEC_NUM_TEMP 默认值:1 将此设置为一个小数目可以节省GPU内存。它也可能会降低并行度,这通常是可以接受的。
  • MXNET_GPU_MEM_POOL_RESERVE 默认值:5 If you see a strange out-of-memory error from the kernel launch, after multiple iterations, try setting this to a larger value.

三 Memonger

  • MXNET_BACKWARD_DO_MIRROR 默认值:0,可选0或1 MXNet 使用镜像概念来节省内存。用于训练阶段来节省设备内存,当设置为1 的时候,在前向传播的时候会复制某些层的fp,反向传播的时候会重新计算这些数据。 MXNET_BACKWARD_DO_MIRROR=1 将会节省30%~50%的显存, 保存95%的运行速度。

四 控制数据通信

  • MXNET_KVSTORE_REDUCTION_NTHREADS 默认值:4 用于总结大数组的CPU线程数。
  • MXNET_KVSTORE_BIGARRAY_BOUND
  • MXNET_ENABLE_GPU_P2P

更多配置信息:

http://mxnet.incubator.apache.org/how_to/env_var.html

五 Mxnet恢复训练

Mxnet可以通过断点恢复训练,命令如下:

python train_end2end.py --network resnet --gpu 0 --resume --begin_epoch 10 --end_epoch 15 --lr_step 15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏岑玉海

Distribute Cached 使用

  在Kettle中说到Pentaho的MapReduce要用到它,就查了一下关于它的资料,以下是从官方查到的内容,记录一下。   DistributedCac...

2424
来自专栏Python、Flask、Django

备份博客数据的小脚本

1174
来自专栏hightopo

基于HT for Web矢量实现3D叶轮旋转

994
来自专栏思考的代码世界

Hexo+Next指定文章隐藏侧栏

1945
来自专栏Web项目聚集地

我珍藏的神兵利器(开发篇)

用了有些年头了,高效、顺滑。也是因为从IDEA开始,让我意识到工具的重要性,在折腾工具的这条路上越走越远。

592
来自专栏大史住在大前端

javascript基础修炼(5)—Event Loop

如果没有详细钻研过异步队列,答对的可能性很低。题目的考察点很明确,就是javascript中最核心的特点之一的【异步】,了解了原理以后,你就会明白javascr...

742
来自专栏牛客网

腾讯视频C++后台

然后开始面试,面试过程比较凌乱,感觉面试官在想问题问,中间比较尴尬。下面是记得的一下题目:

1082
来自专栏hightopo

原 基于HTML5 WebGL实现3D飞机

1415
来自专栏HT

基于HTML5 WebGL实现3D飞机叶轮旋转

在上一篇《基于HT for Web矢量实现2D叶轮旋转》中讲述了叶轮旋转在2D拓扑上的应用,今天我们就来讲讲叶轮旋转在3D上的应用。 在3D拓扑上可以创建各种各...

1928
来自专栏崔庆才的专栏

使用requests+正则表达式爬取猫眼电影排行

本节中,我们利用requests库和正则表达式来抓取猫眼电影TOP100的相关内容。requests比urllib使用更加方便,而且目前我们还没有系统学习HTM...

5807

扫码关注云+社区