首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >内核更新后与NVIDIA驱动程序通信

内核更新后与NVIDIA驱动程序通信
EN

Stack Overflow用户
提问于 2022-03-22 22:14:49
回答 2查看 2K关注 0票数 0

我在运行Ubuntu 20.04。我更新了内核并重新启动,现在nvidia-smi返回:

代码语言:javascript
运行
复制
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

内核版本为5.13.0-35-泛型.

nvidia-驱动程序是由DKMS管理的,我对DKMS并不十分熟悉--尽管我的印象是它是为了阻止这种问题的发生。

dkms status返回:

代码语言:javascript
运行
复制
    nvidia, 455.45.01, 5.4.0-58-generic, x86_64: installed
    nvidia, 455.45.01, 5.8.0-36-generic, x86_64: installed
    nvidia, 455.45.01, 5.8.0-38-generic, x86_64: installed

所以看起来没有当前内核的条目。

到目前为止,我已经尝试通过运行sudo dpkg-reconfigure nvidia-driver-455来用当前内核重新构建nvidia驱动程序。这会运行,但是不会改变任何事情(包括重新启动之后)。

我还尝试用ls /var/lib/initramfs-tools | sudo xargs -n1 /usr/lib/dkms/dkms_autoinstaller start为所有已安装的内核重新构建所有DKMS模块,如下所示:https://askubuntu.com/questions/53364/command-to-rebuild-all-dkms-modules-for-all-installed-kernels。这将返回以下错误:

代码语言:javascript
运行
复制
Kernel preparation unnecessary for this kernel.  Skipping...
applying patch disable_fstack-clash-protection_fcf-protection.patch...patching file Kbuild
Hunk #1 succeeded at 84 (offset 13 lines).


Building module:
cleaning build area...
unset ARCH; [ ! -h /usr/bin/cc ] && export CC=/usr/bin/gcc; env NV_VERBOSE=1 'make' -j16 NV_EXCLUDE_BUILD_MODULES='' KERNEL_UNAME=5.13.0-35-generic IGNOR
E_XEN_PRESENCE=1 IGNORE_CC_MISMATCH=1 SYSSRC=/lib/modules/5.13.0-35-generic/build LD=/usr/bin/ld.bfd modules.....(bad exit status: 2)
ERROR: Cannot create report: [Errno 17] File exists: '/var/crash/nvidia-dkms-455.0.crash'
Error! Bad return status for module build on kernel: 5.13.0-35-generic (x86_64)
Consult /var/lib/dkms/nvidia/455.45.01/build/make.log for more information.
Module nvidia/455.45.01 already installed on kernel 5.4.0-58-generic/x86_64
Module nvidia/455.45.01 already installed on kernel 5.8.0-36-generic/x86_64
Module nvidia/455.45.01 already installed on kernel 5.8.0-38-generic/x86_64

我认为这个错误可能与unset ARCH有关,但我不知道这是什么?

最后,我尝试了同样的sudo apt-get remove nvidia-driver-455; sudo apt-get install nvidia-driver-455,它可以运行,但不能解决问题。

任何帮助都是惊人的-谢谢!

EN

回答 2

Stack Overflow用户

发布于 2022-03-28 09:24:29

我的发行版提供的驱动程序有问题,所以我直接从nvidia安装驱动程序,如果在您的计算机上启用了安全引导,这会有点麻烦。您可以了解如何做那个这里。我还面临着驱动程序在内核更新后没有加载的问题,所以我编写了一个脚本,自动安装最新的驱动程序,您可以找到这里。在给我看司机的档案中,有人说

如果您升级了内核,那么最简单的解决方案就是重新安装驱动程序。

票数 0
EN

Stack Overflow用户

发布于 2022-06-25 12:19:02

在debian 10上安装带有4.XXX内核版本的nvidia vGPU驱动程序时,我重新安装了以下错误“NV_EXCLUDE_vGPU=‘内核_UNAME=4.19.0-20-AMD 64 vGPU”,并且我可以通过以下操作来修复它:1-安装了proxmox之后,NVIDIA驱动程序错误将发生更改(请检查是否信任vfio ),在重新引导服务器2之后,我获得了pve头的错误,所以我下载了导致错误3的.deb头文件--最后,错误为我修复了,但是现在我陷入了另一个错误:-)我也在做这个

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71579565

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档