perf 相关问题

Perf是基于Linux 2.6+系统的分析器工具。

Perf中的怪异回溯

[我使用以下命令以简单的证据基准提取导致用户级别L3缺失的回溯:sudo perf record -d --call-graph dwarf -c 10000 -e mem_load_uops_retired.l3_miss:uppp / ...

回答 1 投票 0

如何在mmap中使用PERF_SAMPLE_READ

此问题与perf_event_open syscall有关,但没有标签。我目前正在寻找使用枚举perf_event_sample_format的PERF_SAMPLE_READ成员检索某些...

回答 1 投票 1

使用RBAC运行性能工具

我最近开始从事一项涉及大量性能调整的工作。我想知道RBAC是否可以使用eBPF和perf之类的工具吗?还是需要完全root用户访问权限?正在生根...

回答 1 投票 1

“ perf_event_open”系统调用通过选项“ PERF_RECORD_SAMPLE”返回的结构中的“ id”和“ stream_id”之间有什么区别?

我正在尝试使用perf_event_open syscall编写一段代码。但是我不了解我的内存映射中返回的结构中id和stream_id字段之间的真正区别。这个...

回答 1 投票 1

我可以在PMC溢出时得到用户空间中断或其他指示吗

我可以配置性能以便在PMC溢出时收到用户空间中断或其他通知吗?也就是说,通常当PMC溢出时,内核会处理更新计数器的操作,并进行采样,...

回答 1 投票 2

内核中的native_write_msr做什么?

我有一个python脚本,开始时有时会很慢。前几天我在上面运行了perf top,我看到的是:PerfTop:2 irqs / sec内核:100.0%精确:0.0%[4000Hz周期],...

回答 1 投票 0

[在哪里使用mmap使用“ perf_event_open”系统调用时,内核返回的结构类型在哪里定义?

我正在尝试使用syscall perf_vent_open从系统获取一些性能数据。我目前正在使用带有环形缓冲区的共享内存进行定期数据检索。但我找不到...

回答 1 投票 0

如何提高性能结果的精度

我正在使用perf来分析C库。但是,它不会产生%100的结果,因为它将数字减小到0.00x以下。由于有成千上万的呼叫,因此会影响整体...

回答 1 投票 0


使用PERF_EVENT_IOC_PERIOD在运行时更改采样周期

我正在pi 3b上使用raspbian Linux 4.9.78-v7 +。我正在使用perf进行一些性能实验。我正在尝试使用perf的PERF_EVENT_IOC_PERIOD在...

回答 1 投票 0

“ perf_event_attr”结构的“ read_format”属性的选项实际上是什么?

我当前正在使用perf_event_open syscall(在Linux系统上,并且我尝试了解此syscall的配置参数,该参数由struct perf_event_attr结构给出。是...

回答 1 投票 1

使用性能工具测量挂钟时间的最佳事件计数器

简单但又复杂的问题:要使用什么计数器来获得性能工具来测量挂钟时间?作为基线,我认为需要分析代码时,第一件事就是墙...

回答 1 投票 1

进行外部化React和React-dom依赖是否会增加React应用的加载时间

我正在开发React应用。应用加载时间过长。我想通过外部化react和react-dom的依赖关系来减少应用程序加载时间。这种方法正确吗?

回答 1 投票 1

Linux perf cache-misses事件的定义?

我正在尝试使用Linux性能来分析缓存性能。性能列表显示有一个cache-misses事件。但是,此“ cache-misses”事件的定义是什么?它是L1D / L1i缓存之一吗,...

回答 1 投票 0

Perf将某些直接跳转指令报告为内存访问指令

我使用以下perf命令通过证据来采样对DRAM的用户空间读取访问:perf record -d --call-graph dwarf -c 100 -e mem_load_uops_retired.l3_miss:uppp /opt/evince-3.28.4/bin/evince如...

回答 1 投票 1

用于确定Perf中库加载地址的机制

在后处理期间,性能如何确定每个加载的图像(例如,共享库)的加载地址。例如,性能报告使用此信息来使每个符号地址相对于...

回答 1 投票 0

使用linux perf和不同的调用图模式对我的程序进行性能分析会得出不同的结果

我想用linux性能分析我的c ++程序。为此,我使用了以下三个命令,但我不明白为什么会得到三个完全不同的报告。性能记录--call-graph矮。/ ...

回答 1 投票 0

perf_event_open和PERF_COUNT_HW_INSTRUCTIONS

我正在尝试使用结构非常复杂的现有应用程序进行概要分析。现在,我正在使用perf_event_open和所需的ioctl调用来启用我感兴趣的事件。 ...

回答 1 投票 2

Linux性能记录未生成任何样本

我正在尝试在具有PMU支持的aria10 fpga板上(带有2个ARM Cortex A9 CPU)分析我的用户空间程序。我正在运行windriver linux版本9.x。我用几乎所有的...

回答 1 投票 0

为什么较新的Intel CPU在后端停止时不支持性能计数器?

我正在使用内存预取来应对内存延迟。 Intel的某些(旧)CPU支持性能计数器,用于计算CPU在等待内存时浪费的周期(stalled-cycles-backend),例如:...

回答 2 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.