要在AWS EC2 g2.2x大型实例上的Ubuntu14.04.1LTS上安装CUDA 6.5,无论我是通过.deb文件还是通过.run文件安装
.sudo ./cuda_6.5.14_linux_64.run --kernel-source-path=/usr/src/linux-headers-3.13.0-34-generic
对于丢失的drm.ko,我总是会遇到相同的错误。代码编译似乎是成功的。下面是原木。(我在安装前重新启动)
内核模块编译完成。 无法确定是否启用了安全引导:没有这样的文件或目录 内核模块加载错误:没有这样的文件或目录 内核消息: 3.595939 type=1400审计(1408809902.911:5):apparmor=“状态” operation="profile_replace“profile=”无限制“ name="/usr/lib/NetworkManager/nm-dhcp-client.action“pid=492 comm="apparmor_parser“ 3.595942 type=1400审计(1408809902.911:6):apparmor=“状态” operation="profile_replace“profile=”无限制“ name="/usr/lib/connman/scripts/dhclient-script“pid=492 comm="apparmor_parser“ 3.596140 type=1400审计(1408809902.915:7):apparmor=“状态” operation="profile_replace“profile=”无限制“ operation="profile_replace“profile=”无限制“ name="/usr/lib/connman/scripts/dhclient-script“pid=492 comm="apparmor_parser“ 4.696067 init:故障安全主进程(833)被术语信号杀死 4.793261 type=1400审计(1408809904.107:8):apparmor=“状态” operation="profile_replace“profile=无限制的”name="/sbin/dhclient“ pid=952 comm="apparmor_parser“ 4.793267 type=1400审计(1408809904.107:9):apparmor=“状态” operation="profile_replace“profile=”无限制“ name="/usr/lib/NetworkManager/nm-dhcp-client.action“pid=952 comm="apparmor_parser“ 5.036249 init:普利茅斯-新贵桥主流程结束,重生。 6.589233 init: udev-回退-图形主进程(1203)终止 状态1 136.367014英伟达:模块许可'NVIDIA‘污染内核。 136.367019由于内核污染而禁用锁调试 136.370281 nvidia:模块验证失败:签名和/或 必需的密钥丢失内核 136.370383 nvidia:未知符号drm_open (err 0) 136.370393 nvidia:未知符号drm_poll (err 0) 136.370404 nvidia:未知符号drm_pci_init (err 0) 136.370449 nvidia:未知符号drm_gem_prime_handle_to_fd (err 0) 136.370462 nvidia:未知符号drm_gem_private_object_init (err 0) 136.370474 nvidia:未知符号drm_gem_mmap (err 0) 136.370478 nvidia:未知符号drm_ioctl (err 0) 136.370486 nvidia:未知符号drm_gem_object_free (err 0) 136.370496 nvidia:未知符号drm_read (err 0) 136.370509 nvidia:未知符号drm_gem_handle_create (err 0) 136.370515 nvidia:未知符号drm_prime_pages_to_sg (err 0) 136.370550 nvidia:未知符号drm_pci_exit (err 0) 136.370563 nvidia:未知符号drm_release (err 0) 136.370565 nvidia:未知符号drm_gem_prime_export (err 0) 驱动程序安装无法找到内核源。请确保内核源代码包的安装和设置正确。
发布于 2014-10-23 09:39:57
该错误是由于缺少NVIDIA驱动程序所需的drm模块造成的。默认情况下,Ubuntu安装最小的通用Linux内核(linux-映像-虚拟),其中不包括drm模块。要修复它,请安装完整的通用内核linux-映像-泛型。安装linux-映像-额外-虚拟将工作,因为它只是一个过渡包linux-映像-通用.我建议安装linux-泛型的同时包含头和图像。概括地说:
sudo apt-get install linux-generic
在AWS forum上也有类似的问题
发布于 2014-08-23 23:15:27
实际上,在GPU实例重新启动之后,apt-get upgrade
希望保留4个包,如linux-virtual
、linux-image-virtual
。我仍然安装了它们,这样我就没有什么可以升级的了。(新设置中没有以前的nvidia或任何新手驱动程序。)
问题是,linux-image-virtual
是一个没有drm.ko
的精益构建。就这么做
sudo apt-get install linux-image-extra-virtual
其中包含drm.ko
。
然后继续使用.deb
或.run
文件安装CUDA。
https://stackoverflow.com/questions/25463952
复制相似问题