首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >openAcc如何评测

openAcc如何评测
EN

Stack Overflow用户
提问于 2013-03-13 18:35:16
回答 1查看 184关注 0票数 0

您好,我正在使用CAPS OpenACC编译器,但当我试图获得一些初步的配置文件结果时,出现了一些问题。

首先,我通过声明HMPPRT_LOG_LEVEL="info“来运行代码,这将生成一些带有时间戳的配置文件结果。

代码语言:javascript
复制
[     2.612337] ( 0) INFO : Upload   edgelengths[0:129600] (element_size=8, queue=none, location=gravity_openacc.c:50)
[     2.613485] ( 0) INFO : Call     __hmpp_acc_region__2ha750yb (queue=none, location=gravity_openacc.c:50)
[     2.614367] ( 0) INFO : Free     edgelengths[0:129600] (element_size=8, queue=none, location=gravity_openacc.c:50)

所以我猜内核执行时间的计算公式是2.614367-2.613485=0.000882秒。

但是,当我声明CUDA_PROFILE=1时,将显示以下配置文件

代码语言:javascript
复制
method=[ __hmpp_acc_region__2ha750yb_parallel_region_1 ] gputime=[ 492.480 ] cputime=[ 13.000 ] occupancy=[ 0.250 ] 

所以我对这两个结果很困惑,哪个是真的?

有人有什么解决方案吗?

谢谢!

EN

回答 1

Stack Overflow用户

发布于 2013-03-21 00:13:19

CUDA分析器只显示执行CUDA内核所需的时间,而使用HMPPRT_LOG_LEVEL="info“获得的日志显示执行区域所需的总时间,这并不完全相同,例如,您可能有一些在主机上执行的代码。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15382876

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档