图形处理器(英语:Graphics Processing Unit,缩写:GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器。 用途是将计算机系统所需要的显示信息进行转换驱动,并向显示器提供行扫描信号,控制显示器的正确显示,是连接显示器和个人电脑主板的重要元件,也是“人机对话”的重要设备之一。显卡作为电脑主机里的一个重要组成部分,承担输出显示图形的任务,对于从事专业图形设计的人来说显卡非常重要,同时也在深度学习领域广泛应用。
NVIDIA系统管理界面(
nvidia-smi)是一个命令行实用程序,基于NVIDIA管理库(NVML),旨在帮助管理和监控NVIDIA GPU设备。 此实用程序允许管理员查询GPU设备状态并具有相应的权限,允许管理员修改GPU设备状态。它针对的是TeslaTM,GRID TM,QuadroTM和TitanX产品,但其他NVIDIA GPU也提供有限的支持。NVIDIA-smi在Linux上配备了NVIDIA GPU显示驱动程序,并配有64位WindowsServer2008R2和Windows7。Nvidia-smi可以将查询信息作为XML或可读的纯文本报告给标准输出或文件形式。
示例 NVIDIA-smi输出:
nvidia-smi是跟nvidia显卡驱动程序放在一起的,所以我们可以在驱动默认安装文件路径 C:\ProgramFiles\NVIDIACorporation\NVSMI里找到文件 nvidia-smi.exe,把该文件拖到CMD窗口,就可以显示关于GPU的信息,如下图所示:
上图是NVIDIA GeForce GTX 750的信息,下面解读参数。
上面的表格框中的信息与下面的四个框的信息是一一对应的:
Pwr:Usage/Cap:能耗;MemoryUsage:显存使用率;domain:bus:device.function;DisplayActive,表示GPU的显示是否初始化;VolatileGPU-Util:浮动的GPU利用率( GPULoad);Uncorr.ECC: ErrorCorrectingCode,错误检查与纠正;ComputeM: compute mode,计算模式。Telegraf提供nvidia-smi采集插件收集GPU性能数据
github地址:https://github.com/influxdata/telegraf/tree/master/plugins/inputs/nvidia_smi
[[inputs.nvidia_smi]]
## Optional: path to nvidia-smi binary, defaults to $PATH via exec.LookPath
bin_path = "C:\\Program Files\\NVIDIA Corporation\\NVSMI\\nvidia-smi.exe"
## Optional: timeout for GPU polling
timeout = "5s"measurement:nvidia_smi
GeForceGTX1070Ti)采集数据示例:
Grafana Dashboard效果
相关系列:
性能工具之JMeter+InfluxDB+Grafana打造压测可视化实时监控