使用Intel Advisor和屋顶线模型,我想评估某个函数的性能。此函数使用Eigen库进行矩阵运算,其中完成了主要工作。
在输出中,我可以看到我的函数具有相对较小的自身时间和几个由我的函数调用的特征函数。现在,我想将我的函数的所有FLOPS和内存操作组合在一起(而不是每个单独的函数),并将此结果用于屋顶线模型。我如何才能做到这一点?
注意:我曾在英特尔支持论坛1中发布过类似的问题。
1
https://stackoverflow.com/questions/55135055
相似问题