你知道perf学习-linux自带性能分析工具怎么用？

什么是perf?

Linux性能调优工具，32内核以上自带的工具，软件性能分析。在2.6.31及后续版本的linux内核里，安装perf非常的容易。

几乎能够处理所有与性能相关的事件。

什么是性能事件？

指在处理器或者操作系统中发生，可能影响到程序性能的硬件事件或者软件事情。

主要关注点在哪里？

算法优化（空间复杂度、时间复杂度）、代码优化（提到执行速度、减少内存占用）

评估程序对硬件资源的使用情况，例如各级cache的访问次数，各级cache的丢失次数、流水线停顿周期、前端总线访问次数等。

评估程序对操作系统资源的使用情况，系统调用次数、上下文切换次数、任务迁移次数。

基本原理？

硬件的话采用PMC（performance monitoring unit）CPU的部件，在特定的条件下探测的性能事件是否发生以及发生的次数。

软件性能测试，内置于kernel，分布在各个功能模块中，统计和操作系统相关性能事件。

如何使用高精度的采样？

如果需要采用高精度的采样，需要在制定性能事情时，在事件后添加后缀“：p”或者“:pp”

[cpp] view plain copy

0：无精度保证

1：采样指令好触发性能时间的指令偏差为常数（:p）

2：尽量保证偏差为0（:pp）

3：保证偏差必须为0(:ppp)

有哪些常用的命令？

1、perf list 列出所有能够触发perf采样点的事件（当前硬件环境支持的性能事件）

总体分为三类hardware（硬件产生）、software（内核软件产生）、tradepoint（内核中静态tracepoint触发事件）。

[html] view plain copy

List of pre-defined events (to be used in -e):

cpu-cycles OR cycles [Hardware event]处理器周期事件

stalled-cycles-frontend OR idle-cycles-frontend [Hardware event]

stalled-cycles-backend OR idle-cycles-backend [Hardware event]

instructions [Hardware event]

cache-references [Hardware event]

cache-misses [Hardware event]

branch-instructions OR branches [Hardware event]

branch-misses [Hardware event]

bus-cycles [Hardware event]

cpu-clock [Software event]

task-clock [Software event]

page-faults OR faults [Software event]

minor-faults [Software event]

major-faults [Software event]

context-switches OR cs [Software event]

cpu-migrations OR migrations [Software event]

alignment-faults [Software event]

emulation-faults [Software event]

L1-dcache-loads [Hardware cache event]

L1-dcache-load-misses [Hardware cache event]

L1-dcache-stores [Hardware cache event]

L1-dcache-store-misses [Hardware cache event]

L1-dcache-prefetches [Hardware cache event]

L1-dcache-prefetch-misses [Hardware cache event]

L1-icache-loads [Hardware cache event]

L1-icache-load-misses [Hardware cache event]

L1-icache-prefetches [Hardware cache event]

L1-icache-prefetch-misses [Hardware cache event]

LLC-loads [Hardware cache event]

LLC-load-misses [Hardware cache event]

LLC-stores [Hardware cache event]

LLC-store-misses [Hardware cache event]

LLC-prefetches [Hardware cache event]

LLC-prefetch-misses [Hardware cache event]

dTLB-loads [Hardware cache event]

dTLB-load-misses [Hardware cache event]

dTLB-stores [Hardware cache event]

dTLB-store-misses [Hardware cache event]

dTLB-prefetches [Hardware cache event]

dTLB-prefetch-misses [Hardware cache event]

iTLB-loads [Hardware cache event]

iTLB-load-misses [Hardware cache event]

branch-loads [Hardware cache event]

branch-load-misses [Hardware cache event]

2、perf stat分析程序的整体性能

利用10个典型事件剖析了应用程序。

task-clock：目标任务真真占用处理器的时间，单位是毫秒，我们称之为任务执行时间，

后面是任务的处理器占用率（执行时间和持续时间的比值）

持续时间值从任务提交到任务结束的总时间（总时间在stat结束之后会打印出来）。

context-switches：上下文切换次数，前半部分是切换次数，后面是平均每秒发生次数（M是10的6次方）。

cpu-migrations：处理器迁移，linux为了位置各个处理器的负载均衡，

会在特定的条件下将某个任务从一个处理器迁往另外一个处理器，此时便是发生了一次处理器迁移。

page-fault：缺页异常，linux内存管理子系统采用了分页机制，

当应用程序请求的页面尚未建立、请求的页面不在内存中或者请求的页面虽在在内存中，

但是尚未建立物理地址和虚拟地址的映射关系是，会触发一次缺页异常。

cycles：任务消耗的处理器周期数

instructions：任务执行期间产生的处理器指令数，IPC（instructions perf cycle）

IPC是评价处理器与应用程序性能的重要指标。（很多指令需要多个处理周期才能执行完毕），

IPC越大越好，说明程序充分利用了处理器的特征。

branches：程序在执行期间遇到的分支指令数。

branch-misses：预测错误的分支指令数

cache-misses：cache时效的次数

cache-references：cache的命中次数

常用的参数如下

[cpp] view plain copy

-e,指定性能事件

-p,指定分析进程的PID

-t,指定待分析线程的TID

-r N，连续分析N次

-d,全面性能分析,采用更多的性能事件

一次分析后的结果如下:

[html] view plain copy

Performance counter stats for process id '21787':

42677.253367 task-clock # 0.142 CPUs utilized

587,906 context-switches # 0.014 M/sec

29,209 CPU-migrations # 0.001 M/sec

117 page-faults # 0.000 M/sec

82,341,400,508 cycles # 1.929 GHz [83.48%]

61,262,984,952 stalled-cycles-frontend # 74.40% frontend cycles idle [83.28%]

43,113,701,768 stalled-cycles-backend # 52.36% backend cycles idle [66.72%]

44,023,301,495 instructions # 0.53 insns per cycle

# 1.39 stalled cycles per insn [83.50%]

8,137,448,528 branches # 190.674 M/sec [83.22%]

430,957,756 branch-misses # 5.30% of all branches [83.34%]

300.393753095 seconds time elapsed

3、perf top实时显示系统/进程的性能统计信息

默认性能事件“cycles CPU周期数”进行全系统的性能剖析

常见的参数如下：

[cpp] view plain copy

-p：指定进程PID

-t：指定线程的TID

-a：分析整个系统的性能（默认）

-d：界面刷新周期，默认是2秒

结果输出中，比例是该符号引发的性能时间在整个监测域中占的比例，通常称为热度。

[html] view plain copy

samples pcnt function DSO

_______ _____ ______________________________________________________________________________________ _________

61.00 19.4% native_write_msr_safe [kernel]

18.00 5.7% JVM_InternString libjvm.so

17.00 5.4% find_busiest_group [kernel]

17.00 5.4% _spin_lock [kernel]

12.00 3.8% dev_hard_start_xmit [kernel]

11.00 3.5% tg_load_down [kernel]

9.00 2.9% futex_wake [kernel]

8.00 2.5% do_futex [kernel]

7.00 2.2% load_balance_fair [kernel]

7.00 2.2% weighted_cpuload [kernel]

7.00 2.2% update_cfs_shares [kernel]

7.00 2.2% JVM_LatestUserDefinedLoader libjvm.so

6.00 1.9% update_cfs_load [kernel]

5.00 1.6% _ZN16SystemDictionary30resolve_instance_class_or_nullE12symbolHandle6HandleS1_P6Thread libjvm.so

5.00 1.6% br_sysfs_delbr [bridge]

5.00 1.6% futex_wait

4、perf record/report记录一段时间内系统/进程的性能事件

默认在当前目录下生成数据文件：perf.data

report读取生成的perf.data文件，-i参数指定路径

了解perf，是性能分析的开始。

http://www.ibm.com/developerworks/cn/linux/l-cn-perf1/

阅读全文

Linux(206513) Linux(206513)
Perfo(7957) Perfo(7957)



请按住滑块，拖动到最右边



了解新功能

一款随Linux内核代码维护的性能诊断工具

Perf Event 是一款随 Linux 内核代码一同发布和维护的性能诊断工具，由内核社区维护和发展。Perf 不仅可以用于应用程序的性能统计分析，也可以应用于内核代码的性能统计和分析。

2018-04-06 09:23:36

7363

如何在命令行模式下使用已有的Linux性能分析

当你登陆一台 Linux 服务器之后，因为一个问题要做性能分析时：你会在第 1 分钟内做哪些检测呢？在 Netflix，我们有很多 EC2 的 Linux 机器，并且也需要很多性能分析工具来监控

2021-02-17 09:45:00

3178

全球最高性能RISC-V处理器的Perf性能分析工具发布

日前，为配合高性能RISC-V处理器昉·天枢Dubhe应用，赛昉科技发布了“赛昉科技Perf性能分析工具”。 Perf是基于Linux的开源性能分析工具，提供对硬件事件、跟踪点、固件事件和动态

2022-04-24 14:53:09

1569

一文详解Linux的perf_event

Linux性能子系统在性能分析中非常有用。以下显示了这篇文章中的perf子系统componenet 。

2022-10-11 09:04:27

1752

Linux性能分析工具汇总

出于对Linux操作系统的兴趣，以及对底层知识的强烈欲望，因此整理了这篇文章。本文也可以作为检验基础知识的指标，另外文章涵盖了一个系统的方方面面。如果没有完善的计算机系统知识，网络知识和操作系统知识，文档中的工具，是不可能完全掌握的，另外对系统性能分析和优化是一个长期的系列。

2022-11-01 13:11:52

405

一文看懂Linux性能分析之perf原理

最近线上运行的程序出现性能问题，但通过分析程序源代码（Code Review），并找不到导致问题的根本原因。所以，只能借助强大的性能分析工具 perf 来找出问题所在。

2022-11-14 12:03:50

1279

Linux性能分析工具大全

今天浩道跟大家分享关于linux性能分析过程中常用到的分析工具！

2023-01-05 09:52:16

463

Linux系统性能分析之Perf命令

在开发板上使用apt安装perf命令：

2023-07-14 15:24:53

517

正在加载...

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

你知道perf学习-linux自带性能分析工具怎么用？

评论