前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >tensorflow gpu 运行出现OOM错误

tensorflow gpu 运行出现OOM错误

作者头像
莫斯
发布2020-09-09 21:17:05
5.4K0
发布2020-09-09 21:17:05
举报
文章被收录于专栏:备份备份

0 问题

今天跑了一下程序,报了如下的OOM错误

代码语言:javascript
复制
ResourceExhaustedError: OOM when allocating tensor with shape[258000,768] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
	 [[{{node rpn_model/rpn_conv_shared/convolution}} = Conv2D[T=DT_FLOAT, data_format="NCHW", dilations=[1, 1, 1, 1], padding="SAME", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](fpn_p2/BiasAdd, rpn_conv_shared/kernel/read)]]
Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.

看报错主要是没内存了,按照如下思路进行纠错

1 解决

1.1 指定GPU

默认使用第0块GPU,该用其他GPU

代码语言:javascript
复制
$ CUDA_VISIBLE_DEVICES=1   python  run_file.py

其他方法见Linux 中指定使用的GPU

注:tf日志中的使用第0块GPU 是相对可见的GPU

1.2 调参

注哟报错中的tensor大小,可以适当的调小参数,以下有几个参数可以参考:

  • batch_size
  • 特征大小,如果输入是图片,建议调小图片大小

1.3 使用CPU

如果GPU 显存实在不够,可以使用CPU

代码语言:javascript
复制
$ CUDA_VISIBLE_DEVICES="" python  run_file.py
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-05-13 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 0 问题
  • 1 解决
    • 1.1 指定GPU
      • 1.2 调参
        • 1.3 使用CPU
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档