在CUDA中,clock()
和clock64()
测量的时钟是多少?
根据CUDA documentation的说法,时钟是“每个多处理器的计数器”。根据我的理解,这指的是主GPU时钟(不是着色器时钟)。
但是,当我使用主GPU时钟频率测量时钟计数并将其转换为时间值时,我得到的结果是实际值的两倍(我使用cuda事件使用主机代码的内核执行时间来测量实际值)。这表明clock()
返回着色器时钟频率,而不是主GPU时钟。
我怎样才能解决这个困惑呢?
编辑:我通过将从cudaGetDeviceProperties获得的时钟频率除以2来计算主图形处理器时钟频率。据我所知,cudaGetDeviceProperties给出的值是着色器时钟频率。
发布于 2014-11-22 01:37:41
确实,CUDA documentation说clock()
和clock64()
返回“每个多处理器的计数器”。但在费米架构中,clock()
和clock64()
实际上返回的是着色器时钟计数器。
cudaGetDeviceProperties返回的clockRate
是着色器时钟频率。
因此,为了计算时间,我们必须将来自clock()
或clock64()
的时钟计数除以从cudaGetDeviceProperties获得的着色器时钟频率。
https://stackoverflow.com/questions/27065862
复制相似问题