perf 相关问题

Perf是基于Linux 2.6+系统的分析器工具。

如何使用 CFLAGS = "-fno-omit-frame-pointer -mno-omit-leaf-frame-pointer" 编译 Python

我正在尝试检查 python 代码的性能分析。 我按照官方文档进行操作。 将我的python3.10更新为python3.12, 我无法在性能报告中获取函数名称 我尝试跑步...

回答 1 投票 0

Linux perf 可以比较每线程性能吗?

我知道 perf 可以使用 perf stat -p tid/pid 或 perf top -p tid/pid 来分析单个进度或单线程。 但我想分析每个线程的进度,并比较事件,获取哪个线程较高

回答 4 投票 0

将 perf 与 GCC 的“-p”选项一起使用

我正在尝试使用 perf 分析一些小型 C 程序,如下所示: $ 性能记录 -F 10000 -g -- ./program 之后,我正在构建火焰图: $ 性能脚本 | stackcollapse 性能 |火焰图 >

回答 1 投票 0

使用带有“-p”选项的 perf

我正在尝试使用 perf 分析一些小型 C 程序,如下所示: $ 性能记录 -F 10000 -g -- ./program 之后,我正在构建火焰图: $ 性能脚本 | stackcollapse 性能 |火焰图 >

回答 1 投票 0

带有时间线视图的 C 分析器/跟踪器

我正在尝试进入 C 语言,并寻找一个支持每个函数调用的时间线视图表示的探查器或跟踪器工具。类似于通过 PHP xDebug 进行跟踪。都在哪里

回答 1 投票 0

为什么将 rg(ripgrep) 与 mmap 一起使用会触发更多次要页面错误?

我正在使用 rg + perf 来测量 mmap 针对 pread 的性能,使用次要页面错误作为性能指标。结果如下: 映射 perf stat -e 主要故障,次要故障 rg -j1 -F 123 a-big-

回答 1 投票 0

安装 perf 失败 util/annotate.c:函数“init_disassemble_info”的参数太少

我编译了5.15.0内核,但是perf安装失败。 我无法通过 apt install 下载 警告:未找到内核 5.15.0 的性能 您可能需要安装以下软件包...

回答 1 投票 0

如何确定cacheline的write allocate产生的内存负载数量?

根据本页和本页,读操作首先会发生对L3缓存的存储未命中,并且在某些情况下可以通过非临时存储来避免。 有没有办法(比如一些 perf ev...

回答 1 投票 0

perf 不在注释中显示源代码,尽管包含了符号

在注释中,perf 只向我显示汇编代码。但是,它确实正确列出了所有符号,并且二进制文件是使用 -g 编译的。此外,文件列出了与 debug_info 相同的二进制文件,而不是

回答 1 投票 0


为什么mem_load_retired.l1_hit和mem_load_retired.l1_miss没有添加到加载总数中?

我正在研究缓存对 x86-64 CPU 性能的影响。我一直在使用 Linux 的 perf 来监控缓存命中/未命中率,特别是这些计数器: mem_inst_retired.all_loads

回答 1 投票 0

Perf:内核模块符号未显示在分析中

加载并运行内核模块,然后通过 perf 进行分析。 $ perf record -a -g --call-graph 矮人睡眠 30 $ 性能报告 我的内核模块的符号不存在于性能报告中。

回答 1 投票 0

测量 AMD Zen2 CPU 上的 LLC/L3 缓存缺失率

我有与此相关的问题。 我想(以编程方式)测量 AMD EPYC 7742 CPU (Zen2) 上的 L3 命中(访问)和未命中。我在 Ubuntu Server 20.04.2 L 上运行 Linux Kernel 5.4.0-66-generic...

回答 1 投票 0

如何解释两个处理器之间巨大的执行速度差异?

我写了一个fortran程序来模拟分子系统。我在一台台式计算机上开发了它,其处理器是 Intel(R) Core(TM) i7-6700 CPU @ 3.40GHz。之后,为了启动大规模模拟,我...

回答 1 投票 0

使用延迟开关时,Perf stat 不会计算事件

我尝试在启动后 20 秒分析我的应用程序,因为我对初始化阶段不感兴趣。 所以我将 perf 与延迟(微秒)开关一起使用: sudo perf stat --delay=2...

回答 1 投票 0

为什么需要mcyclecfg和minstretcfg?

在 RISC-V 中,计划添加新的 CSR。这是 Github 页面上的文档。它针对以下两个问题。 • 它会给观察到的计数器值带来不可预测的噪声...

回答 1 投票 0

CPU 缓存性能。存储未命中与加载未命中

我使用 perf 作为基本事件计数器。我正在开发一个遭受数据缓存存储未命中的程序。其中比例高达80%。 我知道缓存原则上是如何工作的。它从内存加载...

回答 2 投票 0

从寄存器移动到频繁访问的变量时性能出乎意料地缓慢

我正在使用以下示例了解缓存的工作原理: #包括 #包括 #包括 typedef uint32_t data_t; 常量 int U = 10000000; //...

回答 2 投票 0

insmod 命令在插入内核模块时抛出警告消息

我正在测试一个内核模块,它在每个内核上创建性能事件并计算 L2D_CACHE_REFILL 的总数。 系统详细信息:NVIDIA Jetson nano,操作系统:Ubuntu 18.04.6 LTS,内核:4.9.255,L ...

回答 0 投票 0

使用 perf 测量 CPU 周期

目前我正在测量代码执行的时间。 我可以测量执行函数花费了多少时间(使用跟踪点),但我还需要测量执行

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.