NVIDIA vGPU License服务器详解

前言:

当配置有vGPU虚拟机发起License授权请求,授权服务器会根据License中所包含的GRID License版本,加载不同的vGPU驱动(普通驱动和专业Quodra卡驱动)。目前vPC和vApp的License对应加载的都是普通的显示驱动。

vGPU License服务器的工作原理

首先,我们一起先了解一下NVIDIA vGPU的内部架构。vGPU跟传统的GPU类似,具有固定数量的GPU帧缓冲器和一个或多个虚拟显示输出。在vGPU虚拟机被创建的时候,帧缓冲区就被分配到物理GPU的帧缓冲区中,vGPU保留对该缓冲区的独占使用,直到它被销毁为止。留在物理GPU上的所有vGPU虚拟机共享对GPU引擎的访问,包括图形(3D)、视频编解码引擎等。

每次vGPU的虚拟机运行的时候都会向License服务器发起License授权请求:

GRID授权分为三个版本:虚拟工作站vDWS、vPC和虚拟应用vApps,当配置有vGPU虚拟机发起License授权请求,授权服务器会根据License中所包含的GRID License版本,加载不同的vGPU驱动(普通驱动和专业Quodra卡驱动)。目前vPC和vApp的License对应加载的都是普通的显示驱动。

整个License获取和释放的过程发生在如下两个阶段:

1、License获取阶段:

虚拟机在启动的时候通过访问License服务器的地址+端口7070发起License的请求,当正常获取License后加载GRID驱动。

2、License释放阶段:

当关闭虚拟机的时候,之前虚拟机获得的License会自动释放,还回到License服务器中。

注意事项:

当虚拟机处于关闭状态的时候是不占用任何GRID License的。只有在使用Tesla M60/M10 GPU 时,GRID虚拟工作站或虚拟PC的授权版本须经由网络从NVIDIA GRID License 服务器获取到license,激活使用。

vGPU License服务器注意事项

License server支持规格

注意事项(重要):

具有16GB内存的4个CPU的高端配置,适合处理多达15万个许可客户端。主机平台必须运行支持的Windows操作系统。

NVIDIA License Server尽量安装在英文版操作系统(或使用英文版的浏览器)中,不然会产生与web浏览器不兼容的情况

平台必须具有固定(不变)IP地址。平台必须至少有一个不变的以太网MAC地址,以便在注册服务器和在NVIDIA许可门户网站中生成许可证时用作唯一标识符。

平台的日期/时间必须准确设置。

vGPU License服务器部署流程

一、License server软件包获取

1、进入官网

打开NVIDIA官网地址:

http://www.nvidia.com/object/grid-evaluation.html

点击下载软件链接“Software Download”

2、跳转至登录界面

如果之前有过NVIDIA帐号,请在注册界面点击下方的cancel;

如果从未申请过NVIDIA帐号,请先注册,然后登录注册邮箱激活你的帐号。

3、登录NVIDIA账号

如果已存在NVIDIA账号,在注册界面点击下方cancel后,登录NVIDIA账号,

或直接输入:

https://nvid.nvidia.com/dashboard/

登录NVIDIA账号

4、获取License 软件安装包

依次点击: Software &Services -> Product Information NVIDIA Grid,进入下载页面

点击:NVIDIA vGPU for windows/ NVIDIA vGPU for Linux 链接,下载所需软件包

重要一:License软件包介绍

通过上述步骤,可下载到License Manager压缩包:

NVIDIA-GRID-windows-XXXX.XX-XXXX.zip

NVIDIA-GRID-linux-XXXX.XX-XXXX.tgz

Windows安装包,解压后可获取:

setup.exe:用于安装于Windows 虚拟机上

GRID License Server User Guide.pdf:Windows License 服务器用户指南

GRID License Server Release Notes.pdf:Windows License服务器版本说明

Linux安装包,解压后可获取:

setup.bin :用于安装于Linux虚拟机上

GRID License Server User Guide.pdf :Linux License 服务器用户指南

GRID License Server Release Notes.pdf :Linux License服务器版本说明

重要二:获取产品激活密钥(PAK)

获取方法一:从NVIDIA销售处下单并处理订单后,您会收到包含产品激活密钥的欢迎电子邮件。此邮件包含产品激活密钥(PAK),以下是欢迎电子邮件的示例:

获取方法二:如果下单后只拿到许可密钥,可以通过许可密钥为您的账户兑换产品激活密钥(PAK),依次点击:Software & Services Redeem Product Activation Keys,进入Redeem Product Activation Keys页面,在下方表单中输入许可密钥进行兑换:

详见:https://docs.nvidia.com/grid/latest/pdf/grid-vgpu-user-guide.pdf

5、License server 安装

在win10_license服务器上,解压获取到的License软件安装包,NVIDIA-ls-windows-XXXX.XX-XXXX.zip包,运行setup.exe

安装步骤1

选择: “Iaccept the terms of the license Agreement” ,点击 Next;

安装步骤2

选择: “Iaccept the terms of the license Agreement”,点击 Next;

安装步骤3

可自定义安装路径,这里选择默认,点击 Next;

安装步骤4

默认勾选: “License server(port 7070)”,需要勾选上“Managementinterface (port 8080)” ,点击Next;

安装步骤5

点击“Install”

安装步骤6

安装完成,点击”Done”,完成安装。

验证安装

验证许可证服务器是否正常运行,在win7_license服务器主机上打开Web浏览器并连接到http:// localhost:8080/ licserver,显示License管理界面。

二、 获取License文件

步骤1:获取MAC地址

在License管理界面,打开License Server Configuration,通过Server hostID,获取到MAC地址,如下图所示:

步骤2:注册License服务

在有能访问公网的办公电脑上,打开NVIDIA官网登录到”NVIDIA SOFTWARE LICENSING CENTER”页面。

依次点击:Grid Licensingà Register License Server,进入Register License Server页面,将获取到的MAC地址,输入“MAC address”中,并点击“Create”,如下图所示:

创建完成后,需要进入分配license页面。

注意事项:

1、MAC地址指的是授权许可服务器的地址,MAC地址之间不要有冒号;

2、如果没有执行本步骤,会导致导出的BIN文件中,没有真实可用的license信息。

然后在View Server页面单击“Map Add-Ons”,会显示目前账号一共可以分配的用户数。

在Qty to Add框中填入需要分配的用户数量,然后点击Map Add-Ons就完成了分配。

分配的数量可以通过重复上述步骤进行添加和删除,但是测试license不允许调低分配的用户数。

步骤3:下载License文件

创建完后,生成许可证*.bin文件,并下载保存到win10_license服务器上。

6、加载License文件

在win10_License服务器上,打开Licnese Management界面,授权管理平台的地址是:http://localhost:8080/licserver, 显示License管理界面,

从左侧菜单,依次点击:LicenseServer -> License Management,使用License服务器配置菜单导入,刚下载保存好的许可证*.bin文件,并点击Upload。如下图所示:

至此,Win10_License服务器安装完成。

vGPU License服务器常见问题

NVIDIAvGPU License Server组件是我们在实际生产部署以及搭建POC环境的过程中的重要环节。当一个vGPU虚拟机没有正常获取License的时候,其功能会受到很大的限制。由于测试License的申请,以及安装部署过程的注意事项,稍微大意或者缺乏耐心都有可能导致License组件部署失败,以至于影响整个POC测试的效果,所以做这种操作之时要足够仔细、严格按照官方指导要求来!

以下是NVIDIAvGPU License Server组件相关的问题进行的总结,供各位参考。

1.在成功提交测试License申请后,1-2个工作日依然没有收到测试License。

测试License申请:

http://www.nvidia.com/object/nvidia-enterprise-account.html

2.收到测试License PAK(激活码)后,登陆NVIDIA企业门户激活PAK失败。

建议:多数情况下都是由于网络原因导致(激活服务器在国外),所以建议不断的重试PAK的激活操作,此部分操作对耐心有一定的要求。

3.安装部署License组件版本的选择

建议:选择最新的License组件版本安装,新的License组件版本会对之前的版本会有BUG的修复,所以最新版本是一个很好的选择。

4.成功安装部署License组件后,发现License Web管理界面并不能成功的打开

建议:极有可能的一个原因是你安装了JAVA 7,而新的License组件对JAVA版本的要求是32位的Java 8。无论你的操作系统是32位还是64位,请使用JAVA8 32位版本。

5.成功安装部署License组件后,发现License组件并不能正常的工作

建议:很可能的一个原因是你安装License组件的操作系统不在官方支持列表。

6.访问License Web管理面板得到连接被拒绝的提示信息。

建议:检查License服务器的License服务是否正常启动,或者重新启动License服务

7.License组件安装部署成功且License导入成功,vGPU虚拟机却无法正常获取License

建议:请检查vGPU虚拟机到License组件服务器的端口7070是否通畅,可以使用Telnet命令检查,也可以简单粗暴的关闭License组件服务器的防火墙。

8.License组件安装部署成功且License导入成功,vGPU虚拟机却无法正常获取License(已经排除由于防火墙的原因导致)

建议:安装部署License Server组件的时候务必检查License Server的时间和整个环境的时间保持一致。

9.通过LicenseWeb管理面板上传License文件(Bin格式)失败

建议:最大可能的两个原因:1 申请License的Mac地址和License服务器的Mac地址不匹配;2License文件的有效期为24小时,超过24小时未导入到License服务器则必须重新下载License文件,再执行导入操作。

10.成功安装部署License组件后访问License管理界面出现乱码:

建议:使用英文版本的浏览器访问License管理控制面板

除此之外,时间同步要设置好,快照备份也必可不少,防范于未然嘛。

重要申明:公众号平台原创内容版权归作者所有,欢迎以个人名义转发分享并共同讨论,未经允许禁止任何公众号和媒体转载。该文章的最终解释权归作者所有。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180911G1ZC2Y00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券