前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >1.2 cuda相关常见错误记录

1.2 cuda相关常见错误记录

作者头像
锦小年
发布2019-05-28 18:18:55
9540
发布2019-05-28 18:18:55
举报
文章被收录于专栏:锦小年的博客锦小年的博客

1. libcudnn.so.x: file too short

解决办法: 删除软连接后重新建立新的软连接:

代码语言:javascript
复制
# 到cuda目录
# x为cuda版本
# 0.21 是文件的小版本号,可以在文件夹内找到文件名查看
cd /DATA/234/gxrao1/software/cuda-x.0/lib64

# 删除软连接
rm -rf libcudnn.so libcudnn.so.x

#修改文件权限,并创建新的软连接

chmod u=rwx,g=rx,o=rx libcudnn.so.x.0.21

ln -s libcudnn.so.x.0.21 libcudnn.so.x

ln -s libcudnn.so.x libcudnn.so

2. Internal: failed call to cuDevicePrimaryCtxRetain: CUDA_ERROR_INVALID_DEVICE

解决办法:指定运行GPU设备号

代码语言:javascript
复制
# x为gpu device id: 0,1,2,3
import os
os.environ["CUDA_VISIBLE_DEVICES"] = "x"

3. (interrupted by signal 11: SIGSEGV)

并提示cudnn版本不对,需要更新cudnn的版本.例如tensorflow1.11版则需要cudnn7.21以后的版本.下载了7.3.0的版本并覆盖源文件,就好了. 可以需要重复1.中的步骤来重新建立软连接.

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年10月05日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. libcudnn.so.x: file too short
  • 2. Internal: failed call to cuDevicePrimaryCtxRetain: CUDA_ERROR_INVALID_DEVICE
  • 3. (interrupted by signal 11: SIGSEGV)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档