Linux 性能和 MKL

问题描述 投票:0回答:1

我一直在尝试分析我们的应用程序(使用 GCC 5.3 构建并使用 MKL + OMP 的 amd64 RHEL 7.6)。我使用了perf record,但我看到的只是OMP库中的少量样本。 main() 或下面没有任何内容。这是一次 10 分钟的跑步,还有一次只持续一秒钟左右。

MKL + OMP 是否做了一些 perf 无法遵循的非标准线程?

我将尝试运行测试,然后单独运行 perf record -p。

有人有 perf record 和 MKL 的经验吗?也许 VTune 会更好用!

openmp perf intel-mkl
1个回答
0
投票

问题似乎出在 -f(no-)omit-frame-pointer 上。我正在使用 -O3 -g3 进行构建,并且由于某种原因 perf record 无法获取堆栈。我认为 -g3 会抑制 -fomit-frame-pointer 。据推测,MKL 仍然具有帧指针,因此 perf 可以获得其堆栈跟踪。

© www.soinside.com 2019 - 2024. All rights reserved.