CUDA Profiling Guide列出了采样翘曲档位的各种reasons,例如分配、屏障、LG节流等,并且- NSight计算剖析器将这些的分布显示为剖析结果的一部分。
问题是,一些停滞原因被列出为仅从某些计算功能开始支持,例如"LG油门: 7.0+“
我的问题是:在具有较早计算能力的设备中,当停滞原因是这种“不支持”原因时,会发生什么?或者,换句话说,列出的每个停滞原因的后备原因是什么?
在Ye Olde NVIDIA Visual Profiler中,我们有一个“其他”停滞原因,请参阅:
What are "Other" Issue Stall Reasons displayed by the Nsight profiler?
但我在(我的版本) NSight计算中没有看到这一点。
发布于 2021-02-02 14:50:36
夜景计算是not supported and not the recommended profiler for GPUs with a compute capability prior to 7.0。
在不受支持的设置中,没有对工具行为的正式定义。就当是UB吧。
对cc7.0之前的具有计算能力的GPU使用传统探查器(nvvp、nvprof)。
发布于 2021-02-03 07:46:59
在Pascal GPU (sm_61)上使用Nsight 2019.5评测内核,需要7.0+的指标LG Throttle
和Sleeping
不会显示为停滞原因。
https://stackoverflow.com/questions/66011743
复制相似问题