腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为什么我不去看"thread_inst_executed“
cuda
、
gpu
、
profiling
、
nvidia
、
nvprof
当我列出
nvprof
的指标时我看到:
nvprof
--csv --metrics thread_inst_executed,inst_executed,inst_executed_global_loads
浏览 16
提问于2020-07-30
得票数 0
回答已采纳
1
回答
CUDA中的合并读/写
c++
、
cuda
、
profiler
、
nvcc
有没有一种方法可以检查我的内核在全局内存中的读写?我一直在尝试各种方法来确保我的内核高效地读写内存,以获得更好的性能。
浏览 12
提问于2016-09-25
得票数 0
回答已采纳
1
回答
用于非模型计算的Tensorflow分析
gpu
、
profiling
、
tensorflow2.0
有没有办法使用Tensorflow Profiler进行任意的Tensorflow计算,或者在这种情况下,首选是使用
nvprof
等NVidia工具
浏览 13
提问于2021-08-02
得票数 0
1
回答
如何从
nvprof
或NVidia的输出中获得定时值?
xml
、
cuda
、
profiling
、
nvvp
、
text-decoding
我使用
nvprof
来分析某些东西(这包括CPU工作和GPU工作,即我使用
nvprof
标记等等),并且我得到了
nvprof
生成的二进制文件。我可以将它们导入到NVVP (NVidia;
Linux
版本)中,并且只需一点努力就可以将其保存到XML中。 然而..。XML不包含关于我的各种CPU在什么时候做什么的定时数据。
浏览 4
提问于2014-10-01
得票数 1
回答已采纳
1
回答
未找到
nvprof
应用程序
cuda
、
opencl
、
nvidia
、
profiler
我试图使用Nvidia
nvprof
来分析我的数据自动化系统和OpenCL程序。然而,无论我选择哪种基准,唯一的输出是======== Error: application not found.
浏览 3
提问于2014-12-09
得票数 3
回答已采纳
1
回答
是否可以以编程方式确定CUDA分析器是否正在运行?
cuda
、
profiler
我想解决的问题。大多数命令行应用程序在从Visual运行时,我们喜欢强制用户按下退出键,以便在调试时可以在Visual中看到输出。对CUDA分析器的API是相当有限的:
浏览 1
提问于2019-03-07
得票数 2
1
回答
Nvidia可视化分析器错误:无法创建分析文件
cuda
、
profiling
、
openacc
、
pgi
、
nvprof
我是
nvprof
的新用户,当我尝试使用
nvprof
来分析我的代码时,我遇到了一个错误。我在代码中添加了一些OpenACC指令。我使用的cuda工具包是Cuda8.0。-o
nvprof
.out ./incompact3d $WMIN >> $OUT+ OUT=log.txt+ srun
nvprof
-o
nvprof
.out/incompact3d ==20144==
NVPROF
is
浏览 3
提问于2017-10-12
得票数 0
回答已采纳
1
回答
nvprof
和pgprof有什么区别吗?
gpu
、
nvidia
、
pgi
我有兴趣知道pgprof ==
nvprof
+nvvp。例如,我想知道它们是否可以互换。
nvprof
或nvvp是否会将PGI OpenACC应用程序配置为与pgprof完全相同?另外,做一次比较并没有显示出任何明显的区别:$ pgprof --help > help.pgi1c1Note: Only one instance of pgprof> this <em
浏览 17
提问于2018-02-14
得票数 1
回答已采纳
4
回答
多GPU剖析(几个CPU,MPI/CUDA混合)
cuda
、
gpu
、
mpi
、
profiling
、
nvidia
我在论坛上看了一眼,我不认为这个问题已经被问到了。我想利用性能分析工具来分析整个事情。 问题是,启动nvvp的接口8次(如果使用8 CPU/GPU运行)是非常恼人的。我希望避免遍历这个接口,并获得一个命令行,
浏览 1
提问于2012-08-20
得票数 5
回答已采纳
1
回答
nvidia可视分析器遇到无效选项:--openacc-profiling
cuda
、
profiling
、
nsight
、
nvprof
在nvidia Visual上运行一个简单的应用程序将显示错误:======== Use "
nvprof
版本:
nvprof
: NVIDIA (R) Cuda command line profiler Copyright (c) 2013 - 2014 NVIDIA Corporation
浏览 3
提问于2017-04-08
得票数 0
回答已采纳
1
回答
我应该向用户授予sudo,还是添加CAP_SYS_ADMIN功能来使用
nvprof
/ncu?为什么?
pam
、
capabilities
、
setcap
、
cuda
自CUDA 10.1以来,用户必须拥有sudo特权,才能使用cuda分析工具(如
nvprof
或nsight compute (ncu) )收集高级指标。这里描述了绕过它的其他方法:编
浏览 0
提问于2020-07-25
得票数 2
2
回答
分析任意CUDA应用程序
linux
、
cuda
、
nvprof
、
nvvp
当然,我知道nvvp和
nvprof
的存在,但出于各种原因,
nvprof
不想使用涉及大量共享库的应用程序。nvidia-smi可以连接到驱动程序中,以找出正在运行的是什么,但我无法找到一种让
nvprof
附加到正在运行的进程的好方法。有一个标志--profile-all-processes,它确实给了我一个消息"
NVPROF
是剖析过程12345",但没有进一步打印出来。我正在使用CUDA 8。
浏览 2
提问于2018-05-18
得票数 4
1
回答
如何将
nvprof
应用于Kinetica?
nvprof
、
kinetica
谁能给我一个提示,如何将
nvprof
应用到Kinetica?&1 | tee -a ${STARTUP_LOG}; ( exit \${PIPESTATUS[0]} )" $START_PROG"/usr/local/cuda-9.2/bin/
nvprof
--log-file /tmp/
nvprof
/%p.txt --export-profile /tmp/
nvprof
/
浏览 2
提问于2018-10-19
得票数 1
1
回答
nvprof
正在崩溃,因为它将一个非常大的文件写入/tmp/并耗尽磁盘空间。
cuda
、
nvprof
如何解决在可用空间相对较小的磁盘上运行时发生的
nvprof
崩溃?具体来说,在分析我的cuda内核时,我使用以下两个命令:
nvprof
-f -o ~/myproj/profiling/timeline-`date --o ~/myproj/profiling/analysis-metrics-`date -I`.out ~/myproj/build/myexe 第一个
nvprof
命令工作正常。第二个<
浏览 0
提问于2019-05-31
得票数 1
回答已采纳
1
回答
如何在不使用
nvprof
的情况下获得CUDA事件的开始和结束时间
cuda
、
jcuda
、
nvprof
我知道
nvprof
可以生成这样的结果并显示时间表,但是我没有找到一种使用Java应用程序运行
nvprof
的方法。 编辑:现在我了解了如何使用
nvprof
来分析Java应用程序,这要感谢答案。
nvprof
似乎可以获得这些信息,但最终用户没有API可以这样做吗?
浏览 5
提问于2017-05-16
得票数 0
回答已采纳
1
回答
CUDA CC 3.0的l1共享库冲突分析器计数器
cuda
、
gpu
、
profiler
我在
Linux
中使用命令行分析器。
浏览 1
提问于2012-12-17
得票数 4
回答已采纳
2
回答
获取执行时间,单位为
nvprof
cuda
、
nvprof
有没有办法在
nvprof
中获得内核执行时间作为一个指标?
nvprof
--metrics dram_read_transactions ./myprogram
nvprof
--metrics execution_time ./myprogram
nvprof
./myprogram 作为单独的命令。
浏览 6
提问于2018-09-24
得票数 1
1
回答
如何在无头节点上分析CUDA代码?
cuda
、
profiling
、
nvprof
、
nvvp
到目前为止,我所使用的只是命令行分析器
nvprof
,它只显示汇总的统计数据。
nvprof
--analysis-metrics -o application.
nvprof
.
浏览 4
提问于2017-11-07
得票数 0
回答已采纳
1
回答
nvprof
在分析python脚本时使用所有可用的GPU
python
、
cuda
、
profiling
、
nvprof
为了找到可以提高代码性能的地方,我尝试使用
nvprof
。 我已经设置了我的代码,我只想使用远程机器上的两个GPU中的一个,尽管在调用
nvprof
--profile-child-processes .为了只使用一个GPU进行分析,我可以给
nvprof
提供任何论据吗?
浏览 3
提问于2017-04-06
得票数 0
回答已采纳
2
回答
nvprof
output:“没有分析内核”是什么意思,以及如何修复它
cuda
我最近通过系统的包管理器在我的arch-
Linux
机器上安装了Cuda,并且我一直在尝试通过运行一个简单的向量加法程序来测试它是否工作。但是当我尝试在程序上运行Cuda分析器时: > sudo
nvprof
./cuda_test 我得到的结果是: ==3201==
NVPROF
is profiling process 3201, command: .或者这是
nvprof
中的一个错误?有没有办法让
nvprof
显示预期的输出?
浏览 274
提问于2019-08-22
得票数 6
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Linux read的用法
Linux wget 命令用法详解
Linux命令-grep命令基本用法
Linux Shell 数组的基本用法
Linux的fmt 命令用法与案例
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券