前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >1.2 cuda相关常见错误记录

1.2 cuda相关常见错误记录

作者头像
锦小年
发布2019-05-28 18:18:55
1K0
发布2019-05-28 18:18:55
举报
文章被收录于专栏:锦小年的博客

1. libcudnn.so.x: file too short

解决办法: 删除软连接后重新建立新的软连接:

代码语言:javascript
复制
# 到cuda目录
# x为cuda版本
# 0.21 是文件的小版本号,可以在文件夹内找到文件名查看
cd /DATA/234/gxrao1/software/cuda-x.0/lib64

# 删除软连接
rm -rf libcudnn.so libcudnn.so.x

#修改文件权限,并创建新的软连接

chmod u=rwx,g=rx,o=rx libcudnn.so.x.0.21

ln -s libcudnn.so.x.0.21 libcudnn.so.x

ln -s libcudnn.so.x libcudnn.so

2. Internal: failed call to cuDevicePrimaryCtxRetain: CUDA_ERROR_INVALID_DEVICE

解决办法:指定运行GPU设备号

代码语言:javascript
复制
# x为gpu device id: 0,1,2,3
import os
os.environ["CUDA_VISIBLE_DEVICES"] = "x"

3. (interrupted by signal 11: SIGSEGV)

并提示cudnn版本不对,需要更新cudnn的版本.例如tensorflow1.11版则需要cudnn7.21以后的版本.下载了7.3.0的版本并覆盖源文件,就好了. 可以需要重复1.中的步骤来重新建立软连接.

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018年10月05日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. libcudnn.so.x: file too short
  • 2. Internal: failed call to cuDevicePrimaryCtxRetain: CUDA_ERROR_INVALID_DEVICE
  • 3. (interrupted by signal 11: SIGSEGV)
相关产品与服务
GPU 云服务器
GPU 云服务器(Cloud GPU Service,GPU)是提供 GPU 算力的弹性计算服务,具有超强的并行计算能力,作为 IaaS 层的尖兵利器,服务于生成式AI,自动驾驶,深度学习训练、科学计算、图形图像处理、视频编解码等场景。腾讯云随时提供触手可得的算力,有效缓解您的计算压力,提升业务效率与竞争力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档