资料介绍
14.5 C循环结构
循环体是程序设计与优化的重点考虑对象。本节将着重讲解在ARM上处理for和while循环最有效的方法。
14.5.1 循环中止
首先来看下面的例子,两个不同的循环退出条件,产生的不同汇编代码。
C源程序如下所示。
int fact1 (int n)
{
int i, fact = 1;
for (i = 1; i 《= n; i++)
fact *= i;
return (fact);
}
int fact2 (int n)
{
int i, fact = 1;
for (i = n; i != 0; i--)
fact *= i;
return (fact);
}
产生的汇编代码如下所示。
fact1
MOV a3,#1
MOV a2,#1
CMP a1,#1
BLT |L000020.J5.fact1|
|L000010.J4.fact1|
MUL a3,a2,a3
ADD a2,a2,#1
CMP a2,a1
BLE |L000010.J4.fact1|
|L000020.J5.fact1|
MOV a1,a3
MOV pc,lr
fact2
MOVS a2,a1
MOV a1,#1
MOVEQ pc,lr
|L000034.J4.fact2|
MUL a1,a2,a1
SUBS a2,a2,#1
BNE |L000034.J4.fact2|
MOV pc,lr
从产生的汇编代码中,可以看出两个函数虽然实现的功能相同,但产生的代码效率却不尽相同。这里的关键是,循环的中止条件应为计数减到零(count down to zero),而不是计数增加到某个值。由于减计数结果已存储在条件标志里,与零比较的指令就可以省略。同时也可以少用一个寄存器来存储循环中止值。
注意上面的例子使用了-O2 –Otime的编译选项,如果使用-Ospace选项,编译结果会有不同。
对循环计数值i来说,如果i是无符号的,则循环继续的条件既可以是i!=0,也可以是i 》 0。由于i不可能是负数,所以这两个条件是等价的。而对一个有符号的循环计数值来说,最好不要用条件i 》 0作为循环继续执行的条件。如果使用i 》 0作为循环继续执行的条件,编译器将生成下面的代码。
SUB a2,a2,#1
CMP r1,#0
BGT |L000034.J4.fact2|
这时,编译器多增加了一条CMP指令,主要是为了防止有符号数i= −0x8000000。总之,无论对于有符号还是无符号的循环计数值,都应该使用i != 0作为循环的结束条件。对于有符号数i,这比使用i 》 0少了一条指令。
14.5.2 循环展开
在14.5.1节中可以发现,每次循环需要在循环体外加两条指令:一条减法指令来减少循环计数值和一条条件分支指令。通常这些指令称为循环开销(Loop Overhead)。在ARM7或ARM9处理器上,加法指令需要1个周期,条件分支指令需要3个周期,这样每个循环就需要4个周期的开销。
可以通过展开循环体(Loop Unrolling),即重复循环主体多次,同时按同样的比例减少循环次数来降低循环开销。
下面的例子通过将循环体展开4次,来达到减少循环开销的目的。
int countbit1(uint n)
{ int bits = 0;
while (n != 0)
{
if (n & 1) bits++;
n 》》= 1;
}
return bits;
}
将循环主体展开。
int countbit2(uint n)
{ int bits = 0;
while (n != 0)
{
if (n & 1) bits++;
if (n & 2) bits++;
if (n & 4) bits++;
if (n & 8) bits++;
n 》》= 4;
}
return bits;
}
这里减少了4N的循环开销(N=4,即循环体执行的次数)。如果循环体中存在耗时的Store/Load指令,则代码执行效率的提高将更明显。
ARM编译器不会自动将循环体展开,只有用户自己判断何时将循环体展开,到底应该展开多少次,如果循环的次数不是循环展开的倍数该怎么办?下面就将详细讨论,用户编写自己的循环展开程序时,需要注意的问题。
① 只有当循环展开对提高应用程序的整体性能非常重要时,才进行循环展开;否则反而会增加代码尺寸。
② 应设法使循环的次数是循环展开的倍数。如果难以实现,那么就要增加额外的代码来处理数组的剩余元素。这将增加少许代码量,但可以保持较好的性能。
循环体是程序设计与优化的重点考虑对象。本节将着重讲解在ARM上处理for和while循环最有效的方法。
14.5.1 循环中止
首先来看下面的例子,两个不同的循环退出条件,产生的不同汇编代码。
C源程序如下所示。
int fact1 (int n)
{
int i, fact = 1;
for (i = 1; i 《= n; i++)
fact *= i;
return (fact);
}
int fact2 (int n)
{
int i, fact = 1;
for (i = n; i != 0; i--)
fact *= i;
return (fact);
}
产生的汇编代码如下所示。
fact1
MOV a3,#1
MOV a2,#1
CMP a1,#1
BLT |L000020.J5.fact1|
|L000010.J4.fact1|
MUL a3,a2,a3
ADD a2,a2,#1
CMP a2,a1
BLE |L000010.J4.fact1|
|L000020.J5.fact1|
MOV a1,a3
MOV pc,lr
fact2
MOVS a2,a1
MOV a1,#1
MOVEQ pc,lr
|L000034.J4.fact2|
MUL a1,a2,a1
SUBS a2,a2,#1
BNE |L000034.J4.fact2|
MOV pc,lr
从产生的汇编代码中,可以看出两个函数虽然实现的功能相同,但产生的代码效率却不尽相同。这里的关键是,循环的中止条件应为计数减到零(count down to zero),而不是计数增加到某个值。由于减计数结果已存储在条件标志里,与零比较的指令就可以省略。同时也可以少用一个寄存器来存储循环中止值。
注意上面的例子使用了-O2 –Otime的编译选项,如果使用-Ospace选项,编译结果会有不同。
对循环计数值i来说,如果i是无符号的,则循环继续的条件既可以是i!=0,也可以是i 》 0。由于i不可能是负数,所以这两个条件是等价的。而对一个有符号的循环计数值来说,最好不要用条件i 》 0作为循环继续执行的条件。如果使用i 》 0作为循环继续执行的条件,编译器将生成下面的代码。
SUB a2,a2,#1
CMP r1,#0
BGT |L000034.J4.fact2|
这时,编译器多增加了一条CMP指令,主要是为了防止有符号数i= −0x8000000。总之,无论对于有符号还是无符号的循环计数值,都应该使用i != 0作为循环的结束条件。对于有符号数i,这比使用i 》 0少了一条指令。
14.5.2 循环展开
在14.5.1节中可以发现,每次循环需要在循环体外加两条指令:一条减法指令来减少循环计数值和一条条件分支指令。通常这些指令称为循环开销(Loop Overhead)。在ARM7或ARM9处理器上,加法指令需要1个周期,条件分支指令需要3个周期,这样每个循环就需要4个周期的开销。
可以通过展开循环体(Loop Unrolling),即重复循环主体多次,同时按同样的比例减少循环次数来降低循环开销。
下面的例子通过将循环体展开4次,来达到减少循环开销的目的。
int countbit1(uint n)
{ int bits = 0;
while (n != 0)
{
if (n & 1) bits++;
n 》》= 1;
}
return bits;
}
将循环主体展开。
int countbit2(uint n)
{ int bits = 0;
while (n != 0)
{
if (n & 1) bits++;
if (n & 2) bits++;
if (n & 4) bits++;
if (n & 8) bits++;
n 》》= 4;
}
return bits;
}
这里减少了4N的循环开销(N=4,即循环体执行的次数)。如果循环体中存在耗时的Store/Load指令,则代码执行效率的提高将更明显。
ARM编译器不会自动将循环体展开,只有用户自己判断何时将循环体展开,到底应该展开多少次,如果循环的次数不是循环展开的倍数该怎么办?下面就将详细讨论,用户编写自己的循环展开程序时,需要注意的问题。
① 只有当循环展开对提高应用程序的整体性能非常重要时,才进行循环展开;否则反而会增加代码尺寸。
② 应设法使循环的次数是循环展开的倍数。如果难以实现,那么就要增加额外的代码来处理数组的剩余元素。这将增加少许代码量,但可以保持较好的性能。
下载该资料的人也在下载
下载该资料的人还在阅读
更多 >
- C和C++实物精选《C专家编程》 0次下载
- C++程序设计教程之程序设计初步资料说明 7次下载
- C语言实用教程之程序的控制结构资料说明 6次下载
- C语言程序设计教程之选择结构程序设计的资料说明 4次下载
- C语言教程之使用循环结构设计C语言程序的资料说明 2次下载
- C++教程之数据线性结构的详细资料介绍 1次下载
- C++的实验教程之循环结构程序设计的详细资料说明 4次下载
- C语言程序设计教程之循环结构的详细资料说明 12次下载
- C语言程序设计教程之循环结构程序设计资料概述 16次下载
- C语言程序设计教程之结构和其它数据机制的资料概述 9次下载
- C语言教程之循环控制的介绍和详细程序资料说明 7次下载
- C语言程序设计教程之如何设计循环结构 0次下载
- C语言入门教程之循环结构总结的详细资料概述 2次下载
- C语言教程之循环显示随机数问题 0次下载
- C#教程之读取数据库表结构 6次下载
- 技术干货驿站 ▏深入理解C语言:掌握程序结构知识 833次阅读
- 使用 MISRA C++:2023® 避免基于范围的 for 循环中的错误 482次阅读
- plc编程语言与c语言的联系 c语言和PLC有什么区别 3041次阅读
- C语言for循环的用法和注意事项 1641次阅读
- C程序设计基础-数组与结构体 770次阅读
- C程序设计基础-循环结构 686次阅读
- C程序设计基础-顺序结构 764次阅读
- C语言的循环与分支-2 601次阅读
- C语言的循环与分支 809次阅读
- C程序的结构 1016次阅读
- C语言是怎么面向对象编程 1484次阅读
- 从零开始跟我学C语言之循环结构(下) 613次阅读
- 从零开始跟我学C语言之循环结构(上) 735次阅读
- C语言基础语法之结构体 3553次阅读
- pic单片机io口控制教程之c语言编程实现 1.1w次阅读
下载排行
本周
- 1电子电路原理第七版PDF电子教材免费下载
- 0.00 MB | 1490次下载 | 免费
- 2单片机典型实例介绍
- 18.19 MB | 92次下载 | 1 积分
- 3S7-200PLC编程实例详细资料
- 1.17 MB | 27次下载 | 1 积分
- 4笔记本电脑主板的元件识别和讲解说明
- 4.28 MB | 18次下载 | 4 积分
- 5开关电源原理及各功能电路详解
- 0.38 MB | 10次下载 | 免费
- 6基于AT89C2051/4051单片机编程器的实验
- 0.11 MB | 4次下载 | 免费
- 7蓝牙设备在嵌入式领域的广泛应用
- 0.63 MB | 3次下载 | 免费
- 89天练会电子电路识图
- 5.91 MB | 3次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 2PADS 9.0 2009最新版 -下载
- 0.00 MB | 66304次下载 | 免费
- 3protel99下载protel99软件下载(中文版)
- 0.00 MB | 51209次下载 | 免费
- 4LabView 8.0 专业版下载 (3CD完整版)
- 0.00 MB | 51043次下载 | 免费
- 5555集成电路应用800例(新编版)
- 0.00 MB | 33562次下载 | 免费
- 6接口电路图大全
- 未知 | 30320次下载 | 免费
- 7Multisim 10下载Multisim 10 中文版
- 0.00 MB | 28588次下载 | 免费
- 8开关电源设计实例指南
- 未知 | 21539次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935053次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537791次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420026次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233045次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191183次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183277次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138039次下载 | 免费
评论
查看更多