前言
这篇文章我们来聊聊大名鼎鼎的 GDB,它的豪门背景咱就不提了,和它的兄弟 GCC 一样是含着金钥匙出生的。相信每位嵌入式开发工程师都使用过 gdb 来调试程序,如果你说没有用过,那只能说明你的开发经历还不够坎坷,还需要继续被 BUG 吊打。
我们都知道,在使用 GCC 编译时,可以增加 -g 选项在可执行文件中嵌入更多的调试信息,那么具体嵌入了哪些调试信息呢?这些调试信息是如何与二进制的指令之间进行相互交互的呢?在调试的时候,调试信息中是如何获取函数调用栈中的上下文信息的呢?
针对上面这些疑惑,道哥用两篇文章把这些底层最深处的问题彻底描述清楚,让你一次看过瘾。
第一篇文章,就是当前这一篇,主要内容是介绍 GDB 的底层调试原理,我们来看一下 GDB 是通过什么机制来控制指令集的执行。
第二篇文章,我们选择一个体积小巧、五脏俱全的 LUA 语言来进行剖析,从源代码分析到函数调用栈,从指令集到调试库的修改,一网打尽。
内容比较多,看完本文需要的时间可能长一些,为了您的健康,不建议在处于蹲姿的时候阅读这篇文章。
GDB调试模型
GDB 调试包括 2 个程序:gdb 程序和被调试程序。根据这 2 个程序是否运行在同一台电脑中,可以把 GDB 的调试模型分为 2 种:本地调试和远程调试。
本地调试:调试程序和被调试程序运行在同一台电脑中。
远程调试:调试程序运行在一台电脑中,被调试程序运行在另一台电脑中。
关于可视化调试程序并不是重点,它只是一个用来封装 GDB 的外壳而已。我们既可以使用黑乎乎的终端窗口来调试程序;也可以使用集成开发环境(IDE),这个IDE中已经嵌入了调试器,这样就可以单击各种 button 来代替手动输入调试命令了。
与本地调试相比,远程调试中多了GdbServer,它和目标程序都是运行在目标机中,可能是一台x86电脑或者是一个ARM板子。图中的红线表示 GDB 与 GdbServer 之间通过网络或者串口进行通讯。既然是通讯,那么肯定需要一套通讯协议:RSP协议,全称是:GDB Remote Serial Protocol(GDB远程通信协议)。
关于通讯协议的具体格式和内容,我们不需要关心,只需要知道:它们都是字符串,有固定的开始字符('$')和结束字符('#'),最后还有两个十六进制的 ASCII 字符作为校验和,了解这么多就足够了。至于更多的细节,如果实在闲的XX可以瞄几眼,其实这些协议,就像社会中各种奇葩的规定一样,都是一帮砖家在厕所里想出来的。
在第二篇讲解 LUA 的文章中,我们会实现一个类似的远程调试原型。其中的通信协议也是字符串,直接把 HTTP 协议进行简化之后就拿过来使用了,十分清晰、方便。
GDB调试指令
为了完整性,这里把部分 GDB 调试指令贴一下,有感性认识即可。这里没有列举所有的指令,列出的指令都是常用的,比较容易理解。在讲解 LUA 的时候,我们会选择其中的某些指令进行详细的对比,包括底层的实现机制。
每一条具体的调试指令,使用的参数还有很多,例如断点相关的就包括:设置断点、删除断点、条件断点、临时停用启用等等。这篇文章的重点是理解 gdb 底层的调试机制,所以应用层的这些指令的使用方法就不再列出了,网络上的资源很多。
GDB与被调试程序之间的关系
为了方便描述,先写一个最最简单的 C 程序:
编译命令: $ gcc -g test.c -o test
我们对可执行程序 test 进行调试,输入命令:$ gdb ./test,输出如下:
在最后一行可以看到光标在闪烁,这是 gdb 程序在等着我们给他下达调试命令呢。当上面这个黑乎乎的终端窗口在执行 gdb ./test 的时候,在操作系统里发生了很多复杂的事情。
操作系统首先会启动 gdb 进程,这个进程会调用系统函数 fork(),创建一个子进程,这个子进程做两件事情:
(1) 调用系统函数 ptrace(PTRACE_TRACEME,[其他参数]);
(2) 通过 execc 来加载、执行可执行程序 test,那么 test 程序就在这个子进程中开始执行了。
补充一点:文中有时称之程序,有时称之进程。“程序”描述的是一个静态的概念,就是一堆数据躺着硬盘上,而“进程”描述的是动态的过程,是这个程序被读取、加载到内存上之后,在操作系统中有一个任务控制块(一个数据结构),专门用来管理这个进程的。
铺垫了半天,终于轮到主角登场了,那就是系统调用函数 ptrace(其中的参数后面会解释),正是在它的帮助下,gdb 才拥有了强大的调试能力。函数原型是:
我们先来看一下 man 中对这个函数的简介:
tracer 就是调试程序,可以理解为 gdb 程序;tracee 就是被调试程序,对应于图中的目标程序 test。老外一般喜欢用-er和-ee来表示主动和被动的关系,例如:employer 就是雇主(老板),employee 就是苦逼的被雇佣者(打工人)。
ptrace 系统函数是 Linux 内核提供的一个用于进程跟踪的系统调用,通过它,一个进程(gdb)可以读写另外一个进程(test)的指令空间、数据空间、堆栈和寄存器的值。而且 gdb 进程接管了 test 进程的所有信号,也就是说系统向 test 进程发送的所有信号,都被 gdb 进程接收到,这样一来,test 进程的执行就被 gdb 控制了,从而达到调试的目的。
相当于这样一种情况:如果没有 gdb 调试,操作系统与目标进程之间是直接交互的;如果用 gdb 来调试程序,那么操作系统发送给目标进程的信号就会被 gdb 截获,gdb 根据信号的属性来决定:在继续运行目标程序时是否把当前截获的信号转交给 test,被调试程序 test 就在 gdb 发来的信号指挥下进行相应的动作。
GDB如何调试已经执行的服务进程
是否有小伙伴会提出这样一个疑问:上面被调试的程序 test 是从头开始执行的,是否可以用 gdb 来调试一个已经处于执行中的服务进程呢?答曰:可以。这就涉及到 ptrace 系统函数的第一个参数了,这个参数是一个枚举类型的值,其中重要的是2个:PTRACE_TRACEME,PTRACE_ATTACH。
在上面的讲解中,子进程在调用 ptrace 系统函数时使用的参数是PTRACE_TRACEME,注意橙色文字:是子进程调用ptrace,相当于子进程对操作系统说:gdb 进程是我的爸爸,以后你有任何想发给我的信号,请直接发给 gdb 进程吧!
如果想对一个已经执行的进程B进行调试,那么就要在 gdb 这个父进程中调用 ptrace(PTRACE_ATTACH, [其他参数]),此时,gdb 进程会 attach(绑定) 到已经执行的进程B,gdb 把进程B收养成为自己的子进程,而子进程B的行为等同于它进行了一次 PTRACE_TRACEME 操作。此时,gdb 进程会发送 SIGSTOP 信号给子进程B,子进程B接收到 SIGSTOP 信号后,就会暂停执行进入 TASK_STOPED 状态,表示自己准备好被调试了。
所以,不论是调试一个新程序,还是调试一个已经执行的服务程序,通过 ptrace 系统调用,最终的结果都是:gdb 程序是父进程,被调试程序是子进程,子进程的所有信号都被父进程 gdb 来接管,并且父进程 gdb 可查看、修改子进程的内部信息,包括:堆栈、寄存器等。
关于绑定,有几个限制需要了解一下:不予许自我绑定,不允许多次绑定到同一个进程,不允许绑定1号进程。
偷窥GDB如何实现断点指令
大道理已经讲完了,这里我们通过设置断点(break)这个调试指令,来偷窥一下 gdb 内部的调试机制。
还是以上面的代码为例子,这里再重新贴一下代码:
来看一下编译出来的反汇编代码是什么样的(编译指令:gcc -S test.c; cat test.S)
这里只贴了一部分反汇编代码,只要能说明底层的原理就达到我们的目的了。
上面说到,在执行 gdb ./test 之后,gdb 就会 fork 出一个子进程,这个子进程首先调用 ptrace,然后执行 test 程序,这样 gdb 就称为 test 的父进程了,从而可以接管 test 的所有信号。
我们把源码和汇编代码放在一起,方便理解:
现在我们输入调试指令:在调试窗口输入设置断点指令 “break 5” ,此时gdb 做 2 件事情:
(1)对第 5 行源码所对应的汇编代码存储到断点链表中。
(2)在汇编代码的第 10 行,插入中断指令 INT 3,也就是说:汇编代码中的第10行被替换为INT3。
然后,在调试窗口继续输入执行指令“run”(一直执行,直到遇到断点就暂停),汇编代码中的 PC 指针(一个内部指针,指向即将执行的那行代码)执行到第 10 行时,发现是 INT 3 指令,于是操作系统就发送一个 SIGTRAP 信号给 test 进程。
(此刻,第 10 行汇编代码 INT3 就被执行过了,PC指针就指向第11行了。)
上面已经说过,操作系统发给 test 的任何信号,都被 gdb 接管了,也就是说 gdb 会首先接收到这个信号。gdb 发现当前汇编代码执行的是第 10 行,于是到断点链表中查找,发现有第 10 行的代码,说明第 10 行被设置了断点,此刻 gdb 又做了 3 个操作:
(1)把汇编代码中的第 10 行 INT3 替换为断点链表中原来的代码。
(2)把 PC 指针回退一步,也即是设置为指向第 10 行。
(3)继续等待用户的调试指令。
此刻 test 程序就暂停下来了,PC 指针指向第 10 行,也就是源码中的第 5 行。从我们调试者角度看,就是被调试程序在第 5 行断点处暂停了下来,我们可以继续输入其他调试指令来 debug,比如:查看变量值、查看堆栈信息、修改局部变量的值等等。
偷窥GDB如何实现单步指令next
还是以刚才的源代码和汇编代码为例,假设此时程序停止在源码的第 6 行,即汇编代码的第 11 行:
在调试窗口输入单步执行指令“next”,我们的目的是执行一行代码,也就是把源码中第 6 行代码执行完,然后停止在第7行。gdb 在接收到 “next” 执行时,会计算出第 7 行源码,应该对应到汇编代码的第 14 行,于是 gdb 就控制汇编代码中的 PC 指针一直执行到第 13 行结束,也就是 PC 指向第 14 行时,就停止下来,然后继续等待用户输入调试指令。
总结
通过 break 和 next 这2个调试指令,我们已经明白了 gdb 中是如何处理调试指令的了。当然,gdb 中的调试指令还有很多,包括更复杂的获取堆栈信息、修改变量的值等等,有兴趣的小伙伴可以继续深入跟踪。
后面我在写 LUA 语言中的调试库时,会更深入、详细的讨论这个问题,毕竟 LUA 语言更小巧、简单。我也会把 LUA 代码中如何设置 PC 指针的代码部分给小伙伴演示一下,这样我们对于一门编程语言的内部实现就会有更好的理解和掌握,也有可能录一个视频,这样就能更好的讲解 LUA 语言中的内部细节。
-
GCC
+关注
关注
0文章
109浏览量
25188 -
嵌入式开发
+关注
关注
18文章
1066浏览量
48406 -
gdb
+关注
关注
0文章
60浏览量
13502
发布评论请先 登录
gdb调试器解析
使用 GDB 调试多进程程序
Linux应用的GDB调试的原理及过程分析

OpenHarmony系统使用gdb调试init
在ubuntu中调试GDB

GDB调试里怎么设置断点
如何使用GDB调试工具

如何使用linux下gdb来调试python程序

电源入口处防反接电路-汽车电子硬件电路设计
一、为什么要设计防反接电路电源入口处接线及线束制作一般人为操作,有正极和负极接反的可能性,可能会损坏电源和负载电路;汽车电子产品电性能测试标准ISO16750-2的4.7节包含了电压极性反接测试,汽车电子产品须通过该项测试。二、防反接电路设计1.基础版:二极管串联二极管是最简单的防反接电路,因为电源有电源路径(即正极)和返回路径(即负极,GND),那么用二极

半导体芯片需要做哪些测试
首先我们需要了解芯片制造环节做⼀款芯片最基本的环节是设计->流片->封装->测试,芯片成本构成⼀般为人力成本20%,流片40%,封装35%,测试5%(对于先进工艺,流片成本可能超过60%)。测试其实是芯片各个环节中最“便宜”的一步,在这个每家公司都喊着“CostDown”的激烈市场中,人力成本逐年攀升,晶圆厂和封装厂都在乙方市场中“叱咤风云”,唯独只有测试显

解决方案 | 芯佰微赋能示波器:高速ADC、USB控制器和RS232芯片——高性能示波器的秘密武器!
示波器解决方案总述:示波器是电子技术领域中不可或缺的精密测量仪器,通过直观的波形显示,将电信号随时间的变化转化为可视化图形,使复杂的电子现象变得清晰易懂。无论是在科研探索、工业检测还是通信领域,示波器都发挥着不可替代的作用,帮助工程师和技术人员深入剖析电信号的细节,精准定位问题所在,为创新与发展提供坚实的技术支撑。一、技术瓶颈亟待突破性能指标受限:受模拟前端

硬件设计基础----运算放大器
1什么是运算放大器运算放大器(运放)用于调节和放大模拟信号,运放是一个内含多级放大电路的集成器件,如图所示:左图为同相位,Vn端接地或稳定的电平,Vp端电平上升,则输出端Vo电平上升,Vp端电平下降,则输出端Vo电平下降;右图为反相位,Vp端接地或稳定的电平,Vn端电平上升,则输出端Vo电平下降,Vn端电平下降,则输出端Vo电平上升2运算放大器的性质理想运算

ElfBoard技术贴|如何调整eMMC存储分区
ELF 2开发板基于瑞芯微RK3588高性能处理器设计,拥有四核ARM Cortex-A76与四核ARM Cortex-A55的CPU架构,主频高达2.4GHz,内置6TOPS算力的NPU,这一设计让它能够轻松驾驭多种深度学习框架,高效处理各类复杂的AI任务。

米尔基于MYD-YG2LX系统启动时间优化应用笔记
1.概述MYD-YG2LX采用瑞萨RZ/G2L作为核心处理器,该处理器搭载双核Cortex-A55@1.2GHz+Cortex-M33@200MHz处理器,其内部集成高性能3D加速引擎Mail-G31GPU(500MHz)和视频处理单元(支持H.264硬件编解码),16位的DDR4-1600/DDR3L-1333内存控制器、千兆以太网控制器、USB、CAN、

运放技术——基本电路分析
虚短和虚断的概念由于运放的电压放大倍数很大,一般通用型运算放大器的开环电压放大倍数都在80dB以上。而运放的输出电压是有限的,一般在10V~14V。因此运放的差模输入电压不足1mV,两输入端近似等电位,相当于“短路”。开环电压放大倍数越大,两输入端的电位越接近相等。“虚短”是指在分析运算放大器处于线性状态时,可把两输入端视为等电位,这一特性称为虚假短路,简称

飞凌嵌入式携手中移物联,谱写全国产化方案新生态
4月22日,飞凌嵌入式“2025嵌入式及边缘AI技术论坛”在深圳成功举办。中移物联网有限公司(以下简称“中移物联”)携OneOS操作系统与飞凌嵌入式共同推出的工业级核心板亮相会议展区,操作系统产品部高级专家严镭受邀作《OneOS工业操作系统——助力国产化智能制造》主题演讲。

ATA-2022B高压放大器在螺栓松动检测中的应用
实验名称:ATA-2022B高压放大器在螺栓松动检测中的应用实验方向:超声检测实验设备:ATA-2022B高压放大器、函数信号发生器,压电陶瓷片,数据采集卡,示波器,PC等实验内容:本研究基于振动声调制的螺栓松动检测方法,其中低频泵浦波采用单频信号,而高频探测波采用扫频信号,利用泵浦波和探测波在接触面的振动声调制响应对螺栓的松动程度进行检测。通过螺栓松动检测

MOS管驱动电路——电机干扰与防护处理
此电路分主电路(完成功能)和保护功能电路。MOS管驱动相关知识:1、跟双极性晶体管相比,一般认为使MOS管导通不需要电流,只要GS电压(Vbe类似)高于一定的值,就可以了。MOS管和晶体管向比较c,b,e—–>d(漏),g(栅),s(源)。2、NMOS的特性,Vgs大于一定的值就会导通,适合用于源极接地时的情况(低端驱动),只要栅极电压达到4V或10V就可以

压敏(MOV)在电机上的应用剖析
一前言有刷直流电机是一种较为常见的直流电机。它的主要特点包括:1.结构相对简单,由定子、转子、电刷和换向器等组成;2.通过电刷与换向器的接触来实现电流的换向,从而使电枢绕组中的电流方向周期性改变,保证电机持续运转;3.具有调速性能较好等优点,可以通过改变电压等方式较为方便地调节转速。有刷直流电机在许多领域都有应用,比如一些电动工具、玩具、小型机械等。但它也存

硬件原理图学习笔记
这一个星期认真学习了硬件原理图的知识,做了一些笔记,方便以后查找。硬件原理图分为三类1.管脚类(gpio)和门电路类输入输出引脚,上拉电阻,三极管与门,或门,非门上拉电阻:正向标志作用,给悬空的引脚一个确定的状态三极管:反向三极管(gpio输出高电平,NP两端导通,被控制端导通,电压为0)->NPN正向三极管(gpio输出低电平,PN两端导通,被控制端导通,

TurMass™ vs LoRa:无线通讯模块的革命性突破
TurMass™凭借其高传输速率、强大并发能力、双向传输、超强抗干扰能力、超远传输距离、全国产技术、灵活组网方案以及便捷开发等八大优势,在无线通讯领域展现出强大的竞争力。

RZT2H CR52双核BOOT流程和例程代码分析
RZT2H是多核处理器,启动时,需要一个“主核”先启动,然后主核根据规则,加载和启动其他内核。本文以T2H内部的CR52双核为例,说明T2H多核启动流程。

干簧继电器在RF信号衰减中的应用与优势
在电子测试领域,RF(射频)评估是不可或缺的一部分。无论是研发阶段的性能测试,还是生产环节的质量检测,RF测试设备都扮演着关键角色。然而,要实现精准的RF评估,测试设备需要一种特殊的电路——衰减电路。这些电路的作用是调整RF信号的强度,以便测试设备能够准确地评估RF组件和RF电路的各个方面。衰减器的挑战衰减器的核心功能是校准RF信号的强度。为了实现这一点,衰
评论