前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >nvprof 使用记录; 以及使用 nvprof 查看tensorflow-gpu 核函数运行记录

nvprof 使用记录; 以及使用 nvprof 查看tensorflow-gpu 核函数运行记录

作者头像
xuyaowen
发布2020-12-30 14:22:29
1.5K0
发布2020-12-30 14:22:29
举报
文章被收录于专栏:XUYAOWEN的专栏

最近需要使用 nvprof 此时cuda 程序运行的性能,下面对使用过程进行简要记录,进行备忘:

  • 常用使用命令:nvprof --unified-memory-profiling off python run.py (这是因为某块内存被设置了不允许分析,导致)参考:https://docs.nvidia.com/cuda/profiler-users-guide/index.html#unified-memory-profiling
  • nvprof --unified-memory-profiling off python run.py (2>run.txt 1>out.txt)
  • nvprof --unified-memory-profiling off --print-gpu-trace python run.py 
  • nvprof --unified-memory-profiling off --print-gpu-trace -o prof.nvvp python run.py
  • nvvp prof.nvvp (使用 x11 forwarding) 
  • ./run.sh 2>runsh_out.txt 

Non-Visual Profiler 和 Visual Profiler  的使用:

代码语言:javascript
复制
# nvprof
nvprof python train_mnist.py 
nvprof --print-gpu-trace python train_mnist.py 

#nvvp (可以使用x11 forwarding 使用,当然更适合在本机使用)
nvprof -o prof.nvvp python train_mnist.py (在GPU集群上生成 .nvvp文件)
scp your_gpu_machine:/path/to/prof.nvvp . (scp 拷贝文件到本地)
nvvp prof.nvvp (在本地机器上进行可视化分析)

参考链接:

https://blog.csdn.net/yinhuier/article/details/80551268 (简单使用教程)

https://docs.nvidia.com/cuda/profiler-users-guide/index.html (nvidia 官网教程)

https://gist.github.com/sonots/5abc0bccec2010ac69ff74788b265086 (一个日本工程师写的文档,不错,本文大多命令摘自此文档,文档中有较为详细的实例截图,可以参考)

https://blog.csdn.net/haoqimao_hard/article/details/80557740 (CSDN 上较为简洁的博客,可以参考使用)

https://indico-jsc.fz-juelich.de/event/32/material/0/5.pdf (德国一个简单介绍的资料)

保持更新,更多内容请关注 cnblogs.com/xuyaowen; 如果对您有帮助,还请点击推荐或关注~!

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-11-18 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档