首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >具有并发选择的读取事件计数器

具有并发选择的读取事件计数器
EN

Stack Overflow用户
提问于 2015-05-16 18:42:32
回答 1查看 84关注 0票数 1

在同时执行两个内核时,我尝试使用nvprof读取性能计数器。

代码语言:javascript
复制
nvprof --concurrent-kernels on --events fb_subp0_write_sectors ./myprogram

但是,通过这样做,内核执行似乎是序列化的。我想要的是他们在并发运行时的表现。

内核同时运行时,是否可以读取性能计数器?我不需要每个内核的性能,聚合数据是非常好的。

我是运行在开普勒gpu与计算3.5。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-05-17 00:38:05

不是的。nvprof v7.5和更早版本不支持性能计数器的集合,这对于研究并发内核的性能非常有用。我建议您通过NVIDIA开发人员程序提交一个功能请求。这在团队的任务列表上。客户反馈有助于将功能移到列表上。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30279421

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档