BOLT 二进制优化器 建议使用
perf
来分析二进制文件以进行优化。但是,如果“性能不可用”,它们有一个 llvm-bolt
模式,也可以分析应用程序:
如果您无法使用性能记录,您可以通过首先使用 BOLT 检测二进制文件然后运行它来收集配置文件。
显然,这是 BOLT 作者提出的“第二选择”。
这种模式在仪器质量方面有什么缺点?显然,收集仪器的速度较慢,但在生成后续 BOLT 优化调用(生成最终优化的二进制文件)的输入时准确性或效率较低?
根据这篇 LLVM Discourse 帖子中的一位 BOLT 作者,仪器模式是完全准确的(比硬件计数器仪器更准确),并且对用户来说的主要缺点是它运行速度更慢。
他们指出,在某些情况下,运行速度较慢可能会影响收集的配置文件,因为系统的其余部分可能会改变其响应行为,例如负载均衡器向受检测的节点发送较少的流量。