首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >谓词指标出乎意料地高

谓词指标出乎意料地高
EN

Stack Overflow用户
提问于 2021-10-11 07:27:51
回答 1查看 54关注 0票数 1

我正在分析一个内核(nsight 2021.2.1,计算能力8.3,cuda 11.4),并查看为源码行执行的指标Avg线程。据我所知,此值可以介于0和32之间。然而,在我的分析中,它要高得多。

显然,我对谓词指令度量以及平均线程执行方式的理解很差。我应该如何解释这个值,我可以从中得出任何结论吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-10-11 16:23:48

这是源代码视图中的错误。源视图列从装配件说明累计到来源行。这适用于执行的指令和谓词-执行的线程指令,但不适用于平均值。线程已执行。

正确的值为

代码语言:javascript
运行
复制
Predicated-On Thread Instructions Executed / Instructions Executed = Avg Thread Executed
91,714,560,000 / 2,866,080,000 = 32

如果你点击源码行并在SASS视图中查看相关的汇编代码,你可能会发现7条指令。

代码语言:javascript
运行
复制
224 / 32 = 7.
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69522483

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档