前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >菜鸟手册10:谁“杀”了我的进程?

菜鸟手册10:谁“杀”了我的进程?

作者头像
GPUS Lady
发布2020-08-20 14:14:54
1.5K0
发布2020-08-20 14:14:54
举报
文章被收录于专栏:GPUS开发者GPUS开发者

昨天下午有人突然在技术群求救:

原来用户在用Jetson Xavier NX做训练。

于是我们跟他说:

用户还是不死心啊:

回答这个问题之前,我们看看Jetson Xavier NX的规格:

你看,相较于Jetson AGX Xavier 32G memory, NX只有8G memory.

为了让用户接受这个现实,我们提供的建议是:

但是用户没有照着做,而是——

这回出现了大家耳熟能详的——

这几乎也是意料之中了,也是内存不足常见的, 例如分配失败后, 没检查就地使用了, (严重的会被就地kill掉, 不严重的会返回分配失败)

于是我们再次请客户

客户贴出的结果:

确实是OOM。

针对这种情况,我们其实内心也是建议用户要么在台式机上训练,要么可以试试在AGX Xavier上做训练。

当然如果一定要在NX上做训练,可以尝试把batchsize 改小!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-08-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档