perf 相关问题

Perf是基于Linux 2.6+系统的分析器工具。

什么是确定英特尔Kaby Lake架构上最后一级缓存未命中数的确切代码

我读了一篇题为“对最后一级缓存的高分辨率旁道攻击”的有趣论文,并希望找到我自己机器的索引哈希函数,即英特尔酷睿i7-7500U(Kaby ...

回答 1 投票 8

C变量赋值的Perf探测事件

我一直在使用带有malloc的perf探测器,但是当变量赋值发生时似乎找不到合适的perf事件。有这样的事件吗?理想情况下,当int var = 17时;发生......

回答 1 投票 1

什么是do_cos_slow.isra?

我写了一个简单的代码来测试教授。 double bar_compute(double d){double t = std :: abs(d); t + = std :: sqrt(d); t + = std :: cos(d);返回; } //做一些计算n次......

回答 1 投票 2

从内核读取性能寄存器

我想阅读某些性能指标。我知道有像perf这样的工具可以在用户空间本身为我做,我希望代码在Linux内核中。我想写一个......

回答 1 投票 1

更改perf_event_mlock_kb的后果

我试图了解更改/ proc / sys / kernel / perf_event_mlock_kb的确切后果。 perf的手册页说明非特权用户可以敲入的最大页数(2)。 ......

回答 1 投票 2

在Linux上运行进程的perf

对于分析,我们可以在Linux中使用perf。但所有示例仅显示可执行文件。在CentOS中,是否可以在运行进程或守护进程上运行perf工具?

回答 1 投票 1

使用`perf-stat`获得准确的时间测量

我尝试用几种语言编写简单的“hello,world”程序。我在这个领域是n00b,并且由于缺乏示例,性能手册并不容易实现。要做到这一点我...

回答 1 投票 0

在脚本中运行perf-top

我有一些间歇性的性能问题,我想通过perf top捕获。问题是间歇性的,所以我想编写一个脚本,当问题发生时运行perf top,这样我就可以......

回答 1 投票 0

为什么修改指令导致巨大的i-cache和i-TLB在x86上未命中?

以下代码片段仅使用一条RET指令创建一个函数(fun)。循环重复调用该函数并在返回后覆盖RET指令的内容。 #...

回答 1 投票 5

您使用什么工具对您的C ++应用程序进行挂钟分析?

我必须分析我的多线程C ++应用程序并找到它的瓶颈。问题是:我需要查看挂钟配置文件。我使用过oprofile和perf。没人能提供这样的信息。我有 ...

回答 1 投票 4

JMH给予 使用perf进行分析时的值

我想在Java中运行基准测试并获得硬件计数器。我想用JMH这样做,因为它看起来像一个成熟的工具。它还有钩子配置文件的选项(例如perf工具,...

回答 1 投票 0

为什么perf有这么高的上下文切换?

我试图了解linux perf,并发现了一些非常令人困惑的行为:我写了一个简单的多线程示例,其中一个线程固定到每个核心;每个线程运行计算...

回答 2 投票 9

从大型malloced数组读取而不是仅存储时,页面错误数量是两倍?

我正在使用下面的代码对监视页面错误进行简单的测试,我不知道的是下面一行简单的代码如何使我的页面错误计数加倍。如果我使用ptr [i + 4096] ='A'我得到25,722 ......

回答 1 投票 3

硬件缓存事件和性能

当我运行perf list时,我看到一堆硬件缓存事件,如下所示:$ perf list | grep'缓存事件'L1-dcache-load-miss [硬件缓存事件] L1-dcache-loads ...

回答 1 投票 3

perf中的硬件事件和硬件缓存事件有什么区别?

当我输入perf list命令时,我发现有两种事件:硬件事件和硬件缓存事件。两者有什么区别 ?缓存未命中和...之间的区别是什么

回答 2 投票 7

如何记录每个内存访问的带时间戳的跟踪?

有没有办法记录给定程序的每个内存访问,包括时间戳。可以用来做那件事吗?

回答 3 投票 2

如何解读perf属性中的LLC-Load-Misses

我在这里发布了类似背景的问题。在弄清楚几个问题后,我已经把抖动降低了。我将描述我的情景。我的内核启动参数如下:...

回答 1 投票 0

为什么运行空程序需要这么多指令?

最近我在linux中了解了perf命令。我决定进行一些实验,所以我创建了一个空的c程序,并测量了运行所需的指令:echo'int main(){}'> ...

回答 1 投票 3

如何使用perf捕获组合的内核和用户空间堆栈

我正在尝试使用perf捕获组合的用户和内核堆栈,因此我可以看到哪些用户空间代码产生的是特定的内核调用链。基本上我想创建一个看起来像这样的火焰图:...

回答 1 投票 0

英特尔至强上缓存事件的性能计数器

我尝试使用Intel Xeon E5系列的性能计数器(linux perf)。我对缓存未命中的解释感到困惑。虽然可以轻松访问L1和LLC值,但L2的信息......

回答 2 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.