前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >tensorflow: interrupted by signal 9: SIGKILL

tensorflow: interrupted by signal 9: SIGKILL

作者头像
DoubleV
发布2018-09-12 15:09:08
5.6K0
发布2018-09-12 15:09:08
举报
文章被收录于专栏:GAN&CV

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_25737169/article/details/77585023

完整错误信息:Process finished with exit code 137 (interrupted by signal 9: SIGKILL) 出现这个信息说明发生了内存不足的问题,如果是在tensorflow中,可以选择小的batch_size,或者不要把一整个大的文件一次性读到内存里。 如果是ubuntu系统,在命令行里输入

代码语言:javascript
复制
$nvidia-smi

会显示GPU使用情况,从里面也可以看到还有多少内存可以用

这里写图片描述
这里写图片描述

一:如果是因为GPU内存不够,可以在代码里加入:

代码语言:javascript
复制
gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.5) 
config = tf.ConfigProto(allow_soft_placement=True, gpu_options=gpu_options)
tf.Session(condig=config)

其中 0.5表示使用50%的GPU内存资源,tensorflow比较贪心,每次都默认使用最大内存运行,所以内存不够时,可以自己做一个限制。

二:出现此问题的另外一个原因可能是你的cpu不够了,当运行的网络很大的时候,或者需要加载很大的权重,需要cpu来做,容易会导致这个错误,在命令行里输入

代码语言:javascript
复制
$top   

(退出来是ctrl+z)

这里写图片描述
这里写图片描述

可以查看cpu的使用信息,如果发现有其他不想要的进程在占用cpu,可以查看到进程的PID号码,然后使用命令

代码语言:javascript
复制
$sudo kill 262**

后面的数字是PID码

如果出现Process finished with exit code (interrupted by signal 6: SIGKILL)这个信息,可能是cuDNN版本和tensorflow版本不兼容的问题,详细看提示信息

如果是在运行一段时间后出现了这个问题,可能是发生了内存泄露的问题,解决方法可以参考我的另一篇博客http://blog.csdn.net/qq_25737169/article/details/78125550

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017年08月25日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档