前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >GPU监测:小而美的工具

GPU监测:小而美的工具

作者头像
量化投资与机器学习微信公众号
发布2022-03-24 15:40:41
2K0
发布2022-03-24 15:40:41
举报

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。

今天,公众号给大家介绍几个监测GPU的好工具!

前言

1、我们将这次评测限制在Ubuntu上可用的工具。

2、有些工具包是Python的,为了不影响默认的Python安装,我们建议使用Python虚拟环境。案例给出的虚拟环境是Python 3.9。

第一步,执行以下命令:

代码语言:javascript
复制
$ python3 -m venv ~/ENV3
$ source ~/ENV3/bin/activate
$ pip install pip -U

要将其永久添加到启动中,请添加一行代码:

代码语言:javascript
复制
source ~/ENV3/bin/activate

到你的.bash_profile文件。

nvidia-smi

在你安装了Nvidia驱动程序之后,你会发现一个叫Nvidia-smi的程序。可以简单地称之为:

代码语言:javascript
复制
$ nvidia-smi

要定期更新,可以使用以下命令:

代码语言:javascript
复制
$ nvidia-smi -l 1

其中-l后面的参数指定更新之间的时间(秒)。为了不留痕,你还可以使用以下命令:

代码语言:javascript
复制
$ watch -n 1 nvidia-smi

nvitop

https://github.com/XuehaiPan/nvitop

nvitop也是一个类似top的工具,它的特点是可以同时监控多块GPU。这也是小编最喜爱的工具,安装很简单:

代码语言:javascript
复制
pip3 install --upgrade nvitop

以下是部分命令:

代码语言:javascript
复制
# Query status of all devices
$ nvitop -1  # or use `python3 -m nvitop -1`

# Specify query devices (by integer indices)
$ nvitop -1 -o 0 1  # only show <GPU 0> and <GPU 1>

# Only show devices in `CUDA_VISIBLE_DEVICES` (by integer indices or UUID strings)
$ nvitop -1 -ov

# Only show GPU processes with the compute context (type: 'C' or 'C+G')
$ nvitop -1 -c

gmonitor

https://github.com/mountassir/gmonitor

gmonitor是一个简单的GPU监控程序,用于监控内核、VRAM的使用情况、PCI-E和内存总线使用情况以及GPU的温度。

安装需要从源码开始build:

代码语言:javascript
复制
clone https://github.com/mountassir/gmonitor.git
cd gmonitor/
mkdir build
cd build
cmake ..
make
sudo make install

启动很简单:

代码语言:javascript
复制
gmonitor

glances

https://github.com/nicolargo/glances

glances是一个类似于‘top’的工具,除了GPU以为,它还能展示系统其他方面的信息。安装非常简单:

代码语言:javascript
复制
pip install py3nvml
sudo pip install glances[gpu]

启动命令也很简单:

代码语言:javascript
复制
$ glances

还可以通过以下参数设置不同的主题:

代码语言:javascript
复制
$ glances --theme-white

总结

我们展示了几种用于监视GPU的工具。发现这些工具在确保系统正常运行方面非常有用。特别是在显示工作负荷和温度,以及与卡交互的时候。虽然nvidia-smi是首选工具,但其他工具在可视化上面做的更加出色,例如,对于工作负载的展示。我们可以灵活的使用不同的工具,以便对GPU的运行状态有一个更直观和全面的了解。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-03-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量化投资与机器学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,荣获2021年度AMMA优秀品牌力、优秀洞察力大奖,连续2年被腾讯云+社区评选为“年度最佳作者”。
  • 今天,公众号给大家介绍几个监测GPU的好工具!
  • nvidia-smi
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档