英特尔顾问:检查方法,包括所有子方法

问题描述 投票:1回答:1

使用英特尔顾问和屋顶线模型,我想评估某个功能的性能。此函数使用特征库进行矩阵运算,其中主要工作已完成。

在输出中,我可以看到我的函数具有相对较小的自我时间和我的函数调用的几个特征函数。现在我想将我的函数的所有FLOPS和内存操作组合在一起(而不是每个单独的函数),并将此结果用于屋顶线模型。我怎样才能做到这一点?

注意:我在英特尔支持论坛[1]中发布​​了类似的问题。

[1] https://software.intel.com/en-us/forums/intel-advisor-xe/topic/806091

performance eigen3 intel-parallel-studio
1个回答
1
投票

要在Advisor Roofline图表上执行loopnest / functions聚合,您必须运行“使用CallStacks的Roofline”,如https://software.intel.com/en-us/articles/roofline-with-callstacks所述

更具体地说,在命令行的情况下,您必须使用: advixe-cl -collect survey -project-dir MyResults -- MyExecutable advixe-cl -collect tripcounts -flop -stacks -project-dir MyResults -- MyExecutable(NB -stacks extra flag)。

完成后,您需要在图表上找到与您的功能相对应的点并“折叠”它。基本上,带有Callstacks的Roofline可以配置Roofline模型/图表的粒度/嵌套级别。使用“自上而下”视图与Roofline图表并排使用时,或者在展开右侧“roofline call stacks”视图时,使用Callstacks在Roofline上浏览父子点更容易:

navigation using "Roofline stacks view"

© www.soinside.com 2019 - 2024. All rights reserved.