一、gcc 内联汇编
内联汇编即在C中直接使用汇编语句进行编程,使程序可以在C程序中实现C语言不能完成的一些工作,例如,在下面几种情况中必须使用内联汇编或嵌入型汇编。
程序中使用饱和算术运算(Saturating Arithmetic)
程序需要对协处理器进行操作
在C程序中完成对程序状态寄存器的操作
格式:
__asm____volatile__("asmcode" :output :input :changedregisters);
asm或__asm__开头,小括号+分号,括号内容写汇编指令。指令+ 用双引号引上。
「asm code」主要填写汇编代码:
"movr0,r0 " "movr1,r1 " "movr2,r2"
「output(asm->C)」用于定义输出的参数,通常只能是变量:
:"constraint"(variable) "constraint"用于定义variable的存放位置: r表示使用任何可用的寄存器 m表示使用变量的内存地址 +可读可写 =只写 &表示该输出操作数不能使用输入部分使用过的寄存器,只能用"+&"或"=&"的方式使用
「input(C->asm)」用于定义输入的参数,可以是变量也可以是立即数:
:"constraint"(variable/immediate) "constraint"用于定义variable的存放位置: r表示使用任何可用的寄存器(立即数和变量都可以) m表示使用变量的内存地址 i表示使用立即数
Note:
使用__asm__和__volatile__表示编译器将不检查后面的内容,而是直接交给汇编器。
如果希望编译器为你优化,__volatile__可以不加
没有asm code也不能省略""
没有前面的和中间的部分,不可以相应的省略:
没有changed 部分,必须相应的省略:
最后的;不能省略,对于C语言来说这是一条语句
汇编代码必须放在一个字符串内,且字符串中间不能直接按回车换行,可以写成多个字符串,注意中间不能有任何符号,这样就会将两个字符串合并为一个
指令之间必须要换行,还可以使用 使指令在汇编中保持整齐
举例
例1:无参数,无返回值这种情况,output和input可以省略:
asm (//汇编指令 "mrsr0,cpsr " "bicr0,r0,#0x80 " "msrcpsr,r0 " );
例2:有参数 ,有返回值让内联汇编做加法运算,求a+b,结果存在c中
inta=100,b=200,c=0; asm ( "add%0,%1,%2 " :"=r"(c) :"r"(a),"r"(b) :"memory" );
%0 对应变量c%1 对应变量a%2 对应变量b
例3:有参数 2 ,有返回值
让内联汇编做加法运算,求a+b,结果存在sum中,把a-b的存在d中
asmvolatile ( "add%[op1],%[op2],%[op3] " "sub%[op4],%[op2],%[op3] " :[op1]"=r"(sum),[op4]"=r"(d) :[op2]"r"(a),[op3]"r"(b) :"memory" );
%0 对应变量c%1 对应变量a%2 对应变量b
三、ATPCS规则:(ARM、thumber程序调用规范)
为了使单独编译的C语言程序和汇编程序之间能够相互调用,必须为子程序之间的调用规定一定的规则.ATPCS就是ARM程序和THUMB程序中子程序调用的基本规则。
基本ATPCS规定了在子程序调用时的一些基本规则,包括下面3方面的内容:
各寄存器的使用规则及其相应的名称。
数据栈的使用规则。
参数传递的规则。
1. 寄存器的使用必须满足下面的规则:
1)子程序间通过寄存器R0一R3来传递参数,这时,寄存器R0~R3可以记作A1-A4。被调用的子程序在返回前无需恢复寄存器R0~R3的内容。
2)在子程序中,使用寄存器R4~R11来保存局部变量.这时,寄存器 R4 ~ R11可以记作V1 ~ V8。如果在子程序中使用到了寄存器V1~V8中的某些寄存器,子程序进入时必须保存这些寄存器的值,在返回前必须恢复这些寄存器的值;对于子程序中没有用到的寄存器则不必进行这些操作。在Thumb程序中,通常只能使用寄存器R4~R7来保存局部变量。
3)寄存器R12用作过程调用时的临时寄存器(用于保存SP,在函数返回时使用该寄存器出栈), 记作ip。在子程序间的连接代码段中常有这种使用规则。
4)寄存器R13用作数据栈指针,记作sp。在子程序中寄存器R13不能用作其他用途。寄存器sp在进入子程序时的值和退出子程序时的值必须相等。
5)寄存器R14称为连接寄存器,记作lr。它用于保存子程序的返回地址。如果在子程序中保存了返回地址,寄存器R14则可以用作其他用途。
6)寄存器R15是程序计数器,记作pc。它不能用作其他用途。
ATPCS下ARM寄存器的命名:
寄存器 | 别名 | 功能 |
---|---|---|
R0 | a1 | 工作寄存器 |
R1 | a2 | 工作寄存器 |
R2 | a3 | 工作寄存器 |
R3 | a4 | 工作寄存器 |
R4 | v1 | 必须保护;局部变量寄存器 |
R5 | v2 | 必须保护;局部变量寄存器 |
R6 | v3 | 必须保护;局部变量寄存器 |
R7 | v4 | 必须保护;局部变量寄存器 |
R8 | v5 | 必须保护;局部变量寄存器 |
R9 | v6 | 必须保护;局部变量寄存器 |
R10 | sl | 栈限制 |
R11 | fp | 帧指针 |
R12 | ip | 指令指针 |
R13 | sp | 栈指针 |
R14 | lr | 连接寄存器 |
2、堆栈使用规则:
ATPCS规定堆栈为FD类型,即满递减堆栈。并且堆栈的操作是8字节对齐。
而对于汇编程序来说,如果目标文件中包含了外部调用,则必须满足以下条件:
外部接口的数据栈一定是8位对齐的,也就是要保证在进入该汇编代码后,直到该汇编程序调用外部代码之间,数据栈的栈指针变化为偶数个字;
在汇编程序中使用PRESERVE8伪操作告诉连接器,本汇编程序是8字节对齐的.
3、参数的传递规则:
根据参数个数是否固定,可以将子程序分为参数个数固定的子程序和参数个数可变的子程序.这两种子程序的参数传递规则是不同的.
1.参数个数可变的子程序参数传递规则
对于参数个数可变的子程序,当参数不超过4个时,可以使用寄存器R0~R3来进行参数传递,当参数超过4个时,还可以使用数据栈来传递参数.
在参数传递时,将所有参数看做是存放在连续的内存单元中的字数据。然后,依次将各名字数据传送到寄存器R0,R1,R2,R3; 如果参数多于4个,将剩余的字数据传送到数据栈中,入栈的顺序与参数顺序相反,即最后一个字数据先入栈.
按照上面的规则,一个浮点数参数可以通过寄存器传递,也可以通过数据栈传递,也可能一半通过寄存器传递,另一半通过数据栈传递。
举例:
voidfunc(a,b,c,d,e) a--r0 b--r1 c--r2 d--r3 e--栈
2.参数个数固定的子程序参数传递规则
对于参数个数固定的子程序,参数传递与参数个数可变的子程序参数传递规则不同,如果系统包含浮点运算的硬件部件。
浮点参数将按照下面的规则传递:(1)各个浮点参数按顺序处理;(2)为每个浮点参数分配FP寄存器;
分配的方法是,满足该浮点参数需要的且编号最小的一组连续的FP寄存器.第一个整数参数通过寄存器R0~R3来传递,其他参数通过数据栈传递.
3、子程序结果返回规则
1.结果为一个32位的整数时,可以通过寄存器R0返回.
2.结果为一个64位整数时,可以通过R0和R1返回,依此类推.
3.对于位数更多的结果,需要通过调用内存来传递.
举例:
使用r0 接收返回值
intfunc1(intm,intn) m--r0 n--r1 返回值给r0
「为什么有的编程规范要求自定义函数的参数不要超过4个?」答:因为参数超过4个就需要压栈退栈,而压栈退栈需要增加很多指令周期。对于参数比较多的情况,我们可以把数据封装到结构体中,然后传递结构体变量的地址。
四、C语言和汇编相互调用
C和汇编相互调用要特别注意遵守相应的ATPCS规则。
1. C调用汇编
例1:c调用汇编文件中函数带返回值简化代码如下,代码架构可以参考《7. 从0开始学ARM-GNU伪指令、代码编译,lds使用》。
;.asm add: addr2,r0,r1 movr0,r2 MOVpc,lr
main.c
externintadd(inta,intb); printf("%d ",add(2,3));
a->r0,b->r1
返回值通过r0返回计算结果给c代码
例2,用汇编实现一个strcopy函数
;.asm .globalstrcopy strcopy:;R0指向目的字符串;R1指向源字符串 LDRBR2,[R1],#1;加载字字符并更新源字符串指针地址 STRBR2,[R0],#1;存储字符并更新目的字符串指针地址 CMPR2,#0;判断是否为字符串结尾 BNEstrcopy;如果不是,程序跳转到strcopy继续循环 MOVpc,lr;程序返回//.c #include
2. 汇编调用C
//.c intfcn(inta,intb,intc,intd,inte) { returna+b+c+d+e; };.asm; .text.global_start _start: STRlr,[sp,#-4]!;保存返回地址lr ADDR1,R0,R0;计算2*i(第2个参数) ADDR2,R1,R0;计算3*i(第3个参数) ADDR3,R1,R2;计算5*i STRR3,[SP,#-4]!;第5个参数通过堆栈传递 ADDR3,R1,R1;计算4*i(第4个参数) BLfcn;调用C程序 ADDsp,sp,#4;从堆栈中删除第五个参数 .end
假设程序进入f时,R0中的值为i ;
intf(inti){ returnfcn(i,2*i,3*i,4*i,5*i); }
五、内核实例
为了让读者有个更加深刻的理解, 以内核中的例子为例:
arch/arm/kernel/setup.c
voidnotracecpu_init(void) { unsignedintcpu=smp_processor_id();----获取CPUID structstack*stk=&stacks[cpu];----获取该CPU对于的irqabt和und的stack指针 …… #ifdefCONFIG_THUMB2_KERNEL #definePLC"r"----Thumb-2下,msr指令不允许使用立即数,只能使用寄存器。 #else #definePLC"I" #endif__asm__( "msrcpsr_c,%1 "----让CPU进入IRQmode "addr14,%0,%2 "----r14寄存器保存stk->irq "movsp,r14 "----设定IRQmode的stack为stk->irq "msrcpsr_c,%3 " "addr14,%0,%4 " "movsp,r14 "----设定abtmode的stack为stk->abt "msrcpsr_c,%5 " "addr14,%0,%6 " "movsp,r14 "----设定undmode的stack为stk->und "msrcpsr_c,%7"---回到SVCmode :----上面是code,下面的output部分是空的 :"r"(stk),----对应上面代码中的%0 PLC(PSR_F_BIT|PSR_I_BIT|IRQ_MODE),----对应上面代码中的%1 "I"(offsetof(structstack,irq[0])),----对应上面代码中的%2 PLC(PSR_F_BIT|PSR_I_BIT|ABT_MODE),----以此类推,下面不赘述 "I"(offsetof(structstack,abt[0])), PLC(PSR_F_BIT|PSR_I_BIT|UND_MODE), "I"(offsetof(structstack,und[0])), PLC(PSR_F_BIT|PSR_I_BIT|SVC_MODE) :"r14");----上面是input操作数列表,r14是要clobberedregister列表 }
责任编辑:lq
-
寄存器
+关注
关注
31文章
5342浏览量
120276 -
变量
+关注
关注
0文章
613浏览量
28364 -
汇编代码
+关注
关注
0文章
23浏览量
7550
原文标题:C和汇编如何互相调用?嵌入式工程师必须掌握
文章出处:【微信号:mcu168,微信公众号:硬件攻城狮】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论