首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Azure DSVM/DLVM上的nvidia错误

Azure DSVM/DLVM上的nvidia错误
EN

Stack Overflow用户
提问于 2018-01-12 17:30:25
回答 1查看 373关注 0票数 0

我一直在使用GPU在Azure上创建一些Ubuntu DSVM和DLVM,并且不断收到间歇性错误。这些表现为nvidia-smi非常慢或收到以下错误:2018/01/11 19:42:33 Error: nvml: Driver/library version mismatch

如果我尝试运行nvidia-sminvidia-docker,将出现此消息。重启通常会修复它,但它可能会重新出现。

这听起来像是间歇性错误吗?我能做些什么来缓解这个问题吗?

EN

Stack Overflow用户

发布于 2018-01-13 04:44:39

NVIDIA刚刚为Azure中使用的GPU发布了新版本的GPU驱动程序。Ubuntu DSVM配置为自动安装更新,因此将在后台为您安装这些更新。然而,问题是驱动程序被编译到内核中,所以必须重新启动才能获得新的驱动程序。消息驱动程序/库版本不匹配意味着内核中的版本不能使用已安装的库(因为它们已经升级)。这就是为什么重启通常会修复它的原因。

你可能会面临第二个问题: Azure几天前发布了一个新内核,它与387版本的GPU驱动程序不兼容。默认情况下,您不会在DSVM上获得此驱动程序,但如果您安装了其他软件包,则可能会获得此驱动程序。这个错误是不同的-类似nvidia的东西-smi无法与nvidia模块通信。修复它的唯一方法是(1)通过apt更新和apt升级获得最新的内核,然后重启,(2)使用apt install nvidia-384安装不同的驱动程序。

票数 1
EN
查看全部 1 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48223198

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档