首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >安装了NVIDIA驱动程序,但是nvidia-smi没有在CentOS上工作。

安装了NVIDIA驱动程序,但是nvidia-smi没有在CentOS上工作。
EN

Unix & Linux用户
提问于 2018-02-18 06:41:08
回答 2查看 8.2K关注 0票数 1

我安装了一个NVIDIA驱动程序,通过cat /proc/driver/nvidia/version的输出进行了验证:

NVRM版本: NVIDIA UNIX x86_64内核模块390.30 Wed Jan 31 22:08:49 PST 2018版本: GCC版本4.8.5 20150623 (Red 4.8.5-16)

但是,运行nvidia-smi会产生以下错误:bash: nvidia-smi: command not found...

更多信息:我正在运行CentOS 7,并试图: a)让nvidia-smi工作,b)然后安装CUDA。

EN

回答 2

Unix & Linux用户

发布于 2021-03-30 17:18:43

问了3年,一个月前

你说我已经安装了一个NVIDIA驱动程序,但是你没有描述你是如何安装的。请注意,nvidia驱动程序是一个内核模块,当内核更新发生时,它通常会在执行yum update之后丢失;nvidia内核模块不会被保留(除非您安装了DKMS ),因此nvidia功能将停止。

然而,这并不能解释为什么/usr/bin/nvidia-smi说命令找不到--这是另一回事,但这是nvidia-smi应该在哪里,/usr/bin显然应该在您的路径上。只要通过nvidia.run文件重新安装nvidia就可以解决这个问题.

下面是我最喜欢的在RHEL/CentOS 7.x下安装NVIDIA (和cuda)的方法,它为我提供了很好的服务(在过去的3年中)

  • 从nvidia下载NVIDIA-Linux-x86_64-460.67.run {为您的显卡}获得正确的一个大约150 get
  • 从nvidia下载cuda_11.2.2_460.32.03_linux.run {无论最新版本是什么,超过2gb}
  • su指向根;将两者复制到/root;在两者上都复制chmod 700
  • systemctl set-default multi-user.target
  • rebootsystemctl isolate multi-user.targetinit 3
  • 运行/root/NVIDIA x86_64-460.67运行{并观察构建内核模块部分}
  • 安装成功后,/usr/bin/nvidia-smi应在现场工作;
  • 然后执行一个systemctl isolate graphical.targetinit 5,如果图形控制台工作,然后登录,并设置为systemctl set-default graphical.target,如果您愿意。
  • 理想情况下,最后一次重新启动来验证一切正常。

数据自动化系统的安装过程基本上是相同的。

cuda.run文件中捆绑的nvidia图形驱动程序并不总是最新的。

最新的nvidia.run驱动程序将(应该)始终与任何cuda版本一起工作。

您不需要在cuda.run文件中安装捆绑的nvidia图形驱动程序,所以我的首选是在安装cuda时取消检查。

票数 2
EN

Unix & Linux用户

发布于 2022-06-28 07:12:55

通常,在使用新系统时--如果您有sudo访问权限,那么:

首先,试试

sudo apt-获取安装nvidia-cuda-工具箱或sudo yum安装nvidia-cuda-工具箱

取决于您正在使用的系统。

如果这不起作用,那就试试其他解决方案。

对于没有sudo访问机器-从官方网站下载驱动程序,然后安装nvidia驱动程序,然后为相同的驱动程序版本库达。

nvidia-sminvidia-utils包的一部分,需要安装相应的驱动程序版本。

例如:对于nvidia-driver 440,您需要安装sudo apt install nvidia-utils-440

票数 0
EN
页面原文内容由Unix & Linux提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://unix.stackexchange.com/questions/424915

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档