前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >MXNet GluonTS使用报错:OSError: libnccl.so.2: cannot open shared object file: No such file or directory

MXNet GluonTS使用报错:OSError: libnccl.so.2: cannot open shared object file: No such file or directory

作者头像
叶庭云
发布2022-05-09 09:35:57
1.4K0
发布2022-05-09 09:35:57
举报
文章被收录于专栏:Python进阶之路

文章目录

  • 一、问题描述
  • 二、解决方法

一、问题描述

在使用 GPU 服务器安装 GluonTS 做时间序列预测有关的项目时,报错如下(吐槽,用 MXNet 的时候,经常遇到报错emmm):


二、解决方法

这是因为装mxnet-cu112(GPU版本)默认会是 1.9.0 的高版本,如下所示:

在这里插入图片描述
在这里插入图片描述

网上很多方法主要说的就是移除后安装低版本的mxnet,如:pip install mxnet-cu101(cuda版本)==1.7.0。但我用的服务器显卡是RTX 3080,只能安装 cuda>=11.0,可是都是对应 1.8.0 以上的mxnet。在一篇 CSDN 文章的评论区找到有效解决方法,如下所示(必须点个大大的赞):

核心思路就是去 NVIDIA 官网下载跟你 CUDA 版本和操作系统(我的是Ubuntu20.04)适配的 NCCL 文件,然后配置一下。

整个过程用到的命令如下:

代码语言:javascript
复制
!nvidia-smi
!nvcc --version
!sudo lsb_release -a
!find /usr/ -name "libnvrtc*"

# 安装GPU版本的mxnet和gluonts
!pip install mxnet-cu112 -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
!pip install pydantic -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
!pip install gluonts -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

# 配置之前下载的东西
!sudo dpkg -i nccl-local-repo-ubuntu2004-2.8.4-cuda11.2_1.0-1_amd64.deb
!sudo apt update
!sudo apt install libnccl2=2.8.4-1+cuda11.2 libnccl-dev=2.8.4-1+cuda11.2

然后就解决了,可以利用 GPU 跑 MXNet GluonTS 的深度学习模型做时间序列预测项目。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-04-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文章目录
  • 一、问题描述
  • 二、解决方法
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档