首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Intel Advisor:检查包括所有子方法的方法

Intel Advisor:检查包括所有子方法的方法
EN

Stack Overflow用户
提问于 2019-03-13 13:35:34
回答 1查看 134关注 0票数 1

使用Intel Advisor和屋顶线模型,我想评估某个函数的性能。此函数使用Eigen库进行矩阵运算,其中完成了主要工作。

在输出中,我可以看到我的函数具有相对较小的自身时间和几个由我的函数调用的特征函数。现在,我想将我的函数的所有FLOPS和内存操作组合在一起(而不是每个单独的函数),并将此结果用于屋顶线模型。我如何才能做到这一点?

注意:我曾在英特尔支持论坛1中发布过类似的问题。

1

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-03-15 06:26:14

为了在Advisor Roofline图表上执行循环嵌套/函数聚合,您必须按照https://software.intel.com/en-us/articles/roofline-with-callstacks中的描述运行"Roofline with CallStacks“

更具体地说,在命令行的情况下,您必须使用:advixe-cl -collect survey -project-dir MyResults -- MyExecutable advixe-cl -collect tripcounts -flop -stacks -project-dir MyResults -- MyExecutable (NB -stacks extra标志)。

完成后,您需要在图表上找到与您的函数相对应的点,并将其“折叠”。基本上,带有Callstacks的Roofline可以配置Roofline模型/图表的粒度/嵌套级别。使用Callstacks浏览Roofline上的父子点时,无论是并排使用Top-Down视图还是展开右侧的"roofline call stacks“视图,都会更容易:

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55135055

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档