以编程方式启用/禁用性能事件收集

问题描述 投票:0回答:2

我正在使用

perf
在 Ubuntu 20.04 上进行分析(尽管我可以使用任何其他免费工具)。它允许在 CLI 中传递延迟,以便事件收集在程序启动后的某个时间后开始。然而,这个时间变化很大(1000 秒中有 20 秒),并且有一些我也不感兴趣的尾部计算。

因此,最好从我的程序中调用一些API来启动

perf
事件收集我感兴趣的代码片段,然后在代码完成后停止收集。

在循环中运行代码并不是真正的选择,因为有大约 30 秒的初始化阶段和 10 秒的测量阶段,我只对后者感兴趣。

c++ linux api profiling perf
2个回答
4
投票

在被分析的程序(或控制进程)和 perf 进程之间有一个进程间通信机制来实现这一点:使用

--control
格式的
--control=fifo:ctl-fifo[,ack-fifo]
--control=fd:ctl-fd[,ack-fd]
选项,如 perf 中所述-stat(1) 联机帮助页。该选项指定一对 FIFO 文件(命名管道)的路径名或一对文件描述符。第一个文件用于发出命令以启用或禁用正在侦听同一文件的任何 perf 进程中的所有事件。第二个文件是可选的,用于检查 perf 何时实际执行了命令。

手册页中有一个示例,展示了如何使用此选项从 bash 脚本控制 perf 进程,您可以轻松地将其转换为 C/C++:

ctl_dir=/tmp/

ctl_fifo=${ctl_dir}perf_ctl.fifo
test -p ${ctl_fifo} && unlink ${ctl_fifo}
mkfifo ${ctl_fifo}
exec ${ctl_fd}<>${ctl_fifo}        # open for read+write as specified FD

这首先检查文件

/tmp/perf_ctl.fifo
(如果存在)是否是命名管道,然后才将其删除。如果文件不存在,这不是问题,但如果它存在并且不是命名管道,则不应删除该文件,并且
mkfifo
应该失败。
mkfifo
创建一个路径名为
/tmp/perf_ctl.fifo
的命名管道。然后,下一个命令以读/写权限打开文件,并将文件描述符分配给
ctl_fd
。等效的系统调用是
fstat
unlink
mkfifo
open
。请注意,命名管道将由 shell 脚本(控制进程)或正在分析的进程写入,并从 perf 进程中读取。对第二个命名管道
ctl_fd_ack
重复相同的命令,该管道将用于接收来自 perf 的确认。

perf stat -D -1 -e cpu-cycles -a -I 1000       \
          --control fd:${ctl_fd},${ctl_fd_ack} \
          -- sleep 30 &
perf_pid=$!

这会分叉当前进程并在子进程中运行

perf stat
程序,该子进程继承相同的文件描述符。
-D -1
选项告诉 perf 在禁用所有事件的情况下启动。您可能需要按如下方式更改性能选项:

perf stat -D -1 -e <your event list> --control fd:${ctl_fd},${ctl_fd_ack} -p pid

在这种情况下,要分析的程序与控制进程相同,因此告诉 perf 使用

-p
来分析已经运行的程序。等效的系统调用是子进程中的
fork
,后跟
execv

sleep 5  && echo 'enable' >&${ctl_fd} && read -u ${ctl_fd_ack} e1 && echo "enabled(${e1})"
sleep 10 && echo 'disable' >&${ctl_fd} && read -u ${ctl_fd_ack} d1 && echo "disabled(${d1})"

示例脚本休眠约 5 秒,将“enable”写入

ctl_fd
管道,然后检查 perf 的响应以确保事件已启用,然后在约 10 秒后继续禁用事件。等效的系统调用是
write
read

脚本的其余部分删除文件描述符和管道文件。

现在把它们放在一起,你的程序应该如下所示:

/* PART 1
Initialization code.
*/

/* PART 2
Create named pipes and fds.
Fork perf with disabled events.
perf is running now but nothing is being measured.
You can redirect perf output to a file if you wish.
*/

/* PART 3
Enable events.
*/

/* PART 4
The code you want to profile goes here.
*/

/* PART 5
Disable events.
perf is still running but nothing is being measured.
*/

/* PART 6
Cleanup.
Let this process terminate, which would cause the perf process to terminate as well.
Alternatively, use `kill(pid, SIGINT)` to gracefully kill perf.
perf stat outputs the results when it terminates.
*/

0
投票

已接受的答案现在可以作为代码使用https://github.com/rofl0r/libperfstat。这看起来很简单,但是用 C 从头开始编写它需要几个小时,除非你每天都在编写 IPC 代码。

© www.soinside.com 2019 - 2024. All rights reserved.