专栏首页猫先生的日常点滴Horizon系列之CentOS虚拟桌面安装配置VGPU

Horizon系列之CentOS虚拟桌面安装配置VGPU

Windows的VGPU非常简单,一路点鼠标下一步,没有什么难度,Linux的vgpu桌面还是有点坑。

环境:Vcenter6.7 ESXI6.7 Horizon7.8 Centos7.6 GRID VGPU7.2

不同的ESXI和VGPU版本支持的功能不尽相同,在配置之前一定要确定。

一,安装配置VGPU驱动

1,上传GPU的驱动到主机的存储空间,开启主机的ssh,然后登录主机,把驱动复制到/tmp文件夹下,迁移或关闭主机上所有的虚拟机,然后将主机置入维护模式,并安装驱动。

esxcli system maintenanceMode set --enable=true
esxcli software vib install -v /tmp/NVIDIA-VMware_ESXi_6.7_Host_Driver-410.107-1OEM.670.0.0.8169922.x86_64.vib

如果是升级驱动则用下面命令:

esxcli software vib update -v /tmp/NVIDIA-VMware_ESXi_6.7_Host_Driver-410.107-1OEM.670.0.0.8169922.x86_64.vib

卸载驱动用下面的命令:

esxcli software vib remove -n NVIDIA-VMware_ESXi_6.7_Host_Driver

2,查看驱动是否安装成功

esxcli software vib list | grep -i nvidia
nvidia-smi

备注:Tesla M60,Tesla M6和基于Pascal GPU架构的GPU,例如Tesla P100或Tesla P4,支持纠错码(ECC)内存,以提高数据完整性。图形模式下的特斯拉M60和M6 GPU默认情况下禁用ECC内存。NVIDIA vGPU不支持ECC内存。如果启用了ECC内存,则NVIDIA vGPU无法启动。因此,如果使用的是NVIDIA vGPU,则必须确保在所有GPU上禁用ECC内存。早期的M10,M60 还需要手动将模式转为图形模式,出厂默认是计算模式,近几年出的卡不需要,转换方法参考官方文档。

如果nvidia-smi执行报错,先查看ecc是否关闭

nvidia-smi -q

如果没有关闭,执行下面命令关闭ecc

如果要将主机上所有GPU 或分配给VM的vGPU的ECC状态更改为关闭,请运行以下命令:

nvidia-smi -e 0

如果要将特定GPU 或vGPU的ECC状态更改为关闭,请运行以下命令:

nvidia-smi -i id -e 0

id 是执行 nvidia-smi后显示的GPU 或vGPU的索引 即Bus-Id。 比如要禁用Bus-ID为00000000:31:00.0的GPU的ECC

nvidia-smi -i 00000000:31:00.0 -e 0

关闭ecc 的情况下如果还是报错,官网查看驱动版本和当前esxi是否兼容,确定版本没有问题的情况下继续报错,则点击这里确定主机的BIOS设置是否规范。

确认上述步骤无任何问题,把主机退出维护模式,然后重启服务器

esxcli system maintenanceMode set --enable=false
reboot

3,vcenter中选中主机,点击配置,单击图形

图形设备标签下,选择物理GPU,选择直接共享,单击确定,多个GPU,重复操作即可

主机图形标签下,选择物理GPU,选择直接共享,单击确定,多个GPU,重复操作即可

4,如果集群内有多个GPU服务器,可以开启VGPU的vmotion 模式。

点击vcenter实例名称,点击配置,选择高级设置并单击编辑,弹出的窗口中,搜索关键字VGPU,勾选已启用,单击确定。此时vgpu 的vmotion功能已开启。

下表列出了支持VMware vmotion和vGPU的suspend-resume的软件版本

Guest OS

NVIDIA vGPU - VMware vSphereReleases

Pass-Through GPU - VMware vSphere Releases

Red Hat Enterprise Linux 7.0-7.6 and later compatible 7.x versions

6.7, 6.5, 6.0

6.7, 6.5, 6.0

CentOS 7.0-7.6 and later compatible 7.x versions

6.7, 6.5, 6.0

6.7, 6.5, 6.0

Red Hat Enterprise Linux 6.6 and later compatible 6.x versions

6.7, 6.5, 6.0

6.7, 6.5, 6.0

CentOS 6.6 and later compatible 6.x versions

6.7, 6.5, 6.0

6.7, 6.5, 6.0

Ubuntu 18.04 LTS

6.7, 6.5, 6.0

6.7, 6.5, 6.0

Ubuntu 16.04 LTS

6.7, 6.5, 6.0

6.7, 6.5, 6.0

Ubuntu 14.04 LTS

6.7, 6.5, 6.0

6.7, 6.5, 6.0

SUSE Linux Enterprise Server 12 SP3

6.7, 6.5, 6.0

6.7, 6.5, 6.0

并且只有以下GPU支持vmotion

Tesla M6
Tesla M10
Tesla M60
Tesla P4
Tesla P6
Tesla P40
Since 7.1: Tesla T4

二,配置虚拟机模板

下面关键内容仅对付费用户开放,账号信息加我微信获取!

该部分仅登录用户可见

版权说明:若无注明,本文皆为“猫先生的日常点滴”原创,转载请保留文章出处。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • WWN,WWNN,WWPN三者的区别

    如果是光纤交换机的话wwn和wwnn是一样的,而wwpn是指每个光纤端口. 如果是HBA卡的话,若是只有一个端口则三者可能一样,若是有多个端口则和交换机差不多....

    Mr.Mao Notes
  • IBM V系列存储常用命令

    Mr.Mao Notes
  • Linux下配置ssh免密登录

    上述过程实现了root用户的互信,如果需要其他用户互信,那么生成的密钥就必须在/home/user/.ssh/下

    Mr.Mao Notes
  • 教程 | 如何在Julia编程中实现GPU加速

    为了简化操作,可以在 nextjournal 上注册账户,点击「edit」即可直接运行文章中的简单代码了。

    机器之心
  • 手把手教你如何用Julia做GPU编程(附代码)

    GPU是一个大规模并行处理器,具有几千个并行处理单元。 例如,本文中使用的Tesla k80提供4992个并行CUDA内核。 GPU在频率,延迟和硬件功能方面与...

    新智元
  • 基础知识 | 每日一练(185)

    读者:用户输入M ,N 值,从1至N 开始顺序循环数数,每数到M 输出该数值,直至全部输出。写出C程序。

    闫小林
  • iptables 扩展案例

    iptables filter表小案例 : 案例1: 需要把80,21,22端口放行;但是22端口需要指定特殊的IP地址段可以访问,其它的均不可以访问;使用sh...

    老七Linux
  • Linux学习笔记之Linux最小化安装启动后如何配置

    在VM虚拟机中安装CentOS 7 时 有时候顾虑到电脑硬件性能,我们需要最小化安装,而最小化安装后与centos6的版本是有一些差异的,接下来我们就对刚安装好...

    Jetpropelledsnake21
  • SEO学习【一】入门

    SEO是英文单词Search Engine Optimization的缩写,即搜索引擎优化,简单的说,SEO是指从自然搜索结果获取网站流量的技术和过程。

    用户2936342
  • python之crawlspider初探

    <pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: bre...

    用户5760343

扫码关注云+社区

领取腾讯云代金券