资料介绍
14.2 除法运算
因为ARM体系结构本身并不包含除法运算硬件,所以在ARM上实现除法是十分耗时的。ARM指令集中没有直接提供除法汇编指令,当代码中出现除法运算时,ARM编译器会调用C库函数(有符合除法调用_rt_sdiv,无符合除法调用_rt_udiv),来实现除法操作。根据除数和被除数的不同,32bit的除法运算一般要占有20-140个指令周期。除法运算占用的指令周期,由下面公式计算。
Time(除数n / 被除数d)
= C0 + C1 * log2(除数n / 被除数d) =
= C0 + C1 * (log2(除数) -log2(被除数))。
为了避免在程序中出现除法操作,编程时尽量使用其他运算来代替除法操作。如,使用x》(z×y)来代替(x/y)》z。
另外,在无法避免的除法运算中,尽量使用无符合除法代替有符号除法。这是因为在ARM库函数中,无符合除法的运算速度要快于有符合除法。
下面章节将详细讨论如何在代码中提高除法运算的执行效率。
14.2.1 合并除法和求余运算
ARM的除法运算库函数能同时返回运算的商和余数。
在一些同时需要商和余数的情况下,编译器将调用一次除法运算函数同时存储运算的商和余数。
下面是一个编译器调用除法库,同时存储运算的商和余数的例子。
源程序如下。
int combined_div_mod (int a, int b)
{
return (a / b) + (a % b);
}
下面是编译器编译出的汇编代码。
combined_div_mod
STMDB sp!,{lr}
MOV a3,a2
MOV a2,a1
MOV a1,a3
BL __rt_sdiv
ADD a1,a1,a2
LDMIA sp!,{pc}
从上面的例子可以看出,调用一次除法运算,同时返回了商和余数。
14.2.2 使用2的整数次幂做除数
当2的整数次幂做除数时,编译器会自动将除法运算转换成移位运算。所以在编写程序算法时,尽量使用2的整数次幂做除数。
下面的例子显示了编译器对除法运算的自动优化。
源程序如下。
typedef unsigned int uint;
uint div16u (uint a)
{ return a / 16;
}
int div16s (int a)
{ return a / 16;
}
编译器的编译结果如下。
div16u
MOV a1,a1,LSR #4
MOV pc,lr
div16s
CMP a1,#0
ADDLT a1,a1,#&f
MOV a1,a1,ASR #4
MOV pc,lr
从上面的例子可以看出,无符号除法的运算速度快于有符号除法。
14.2.3 求余运算
为了避免在程序中使用除法运算,可以将一些典型的求余运算进行转换。下面的例子提供一种转换方法。
uint counter1 (uint count)
{ return (++count % 60);
}
转换成,
uint counter2 (uint count)
{ if (++count 》= 60)
count = 0;
return (count);
}
下面是两个功能函数编译后的汇编代码。
counter1
STMDB sp!,{lr}
ADD a2,a1,#1
MOV a1,#&3c
BL __rt_udiv
MOV a1,a2
LDMIA sp!,{pc}
counter2
ADD a1,a1,#1
CMP a1,#&3c
MOVCS a1,#0
MOV pc,lr
上面的例子清晰的显示了使用if语句代替除法运算后,代码的执行效率有很大提高。
14.2.4 除数是常数的除法
因为除法和模运算执行起来比较慢,所以应该尽可能地避免使用。但是除数是常数的除法运算和用同一个除数的重复除法,执行效率会比较高。在ARM的除法库中,存在除数为10的除法运算库,其中包括有符号除法和无符号除法。如果除数是10以外的其他常数,用户可以编写自己的功能函数。ARM的开发工具集中,提供了关于除数是常数的示例程序和算法分析,以供用户编写自己的代码时参考。
因为ARM体系结构本身并不包含除法运算硬件,所以在ARM上实现除法是十分耗时的。ARM指令集中没有直接提供除法汇编指令,当代码中出现除法运算时,ARM编译器会调用C库函数(有符合除法调用_rt_sdiv,无符合除法调用_rt_udiv),来实现除法操作。根据除数和被除数的不同,32bit的除法运算一般要占有20-140个指令周期。除法运算占用的指令周期,由下面公式计算。
Time(除数n / 被除数d)
= C0 + C1 * log2(除数n / 被除数d) =
= C0 + C1 * (log2(除数) -log2(被除数))。
为了避免在程序中出现除法操作,编程时尽量使用其他运算来代替除法操作。如,使用x》(z×y)来代替(x/y)》z。
另外,在无法避免的除法运算中,尽量使用无符合除法代替有符号除法。这是因为在ARM库函数中,无符合除法的运算速度要快于有符合除法。
下面章节将详细讨论如何在代码中提高除法运算的执行效率。
14.2.1 合并除法和求余运算
ARM的除法运算库函数能同时返回运算的商和余数。
在一些同时需要商和余数的情况下,编译器将调用一次除法运算函数同时存储运算的商和余数。
下面是一个编译器调用除法库,同时存储运算的商和余数的例子。
源程序如下。
int combined_div_mod (int a, int b)
{
return (a / b) + (a % b);
}
下面是编译器编译出的汇编代码。
combined_div_mod
STMDB sp!,{lr}
MOV a3,a2
MOV a2,a1
MOV a1,a3
BL __rt_sdiv
ADD a1,a1,a2
LDMIA sp!,{pc}
从上面的例子可以看出,调用一次除法运算,同时返回了商和余数。
14.2.2 使用2的整数次幂做除数
当2的整数次幂做除数时,编译器会自动将除法运算转换成移位运算。所以在编写程序算法时,尽量使用2的整数次幂做除数。
下面的例子显示了编译器对除法运算的自动优化。
源程序如下。
typedef unsigned int uint;
uint div16u (uint a)
{ return a / 16;
}
int div16s (int a)
{ return a / 16;
}
编译器的编译结果如下。
div16u
MOV a1,a1,LSR #4
MOV pc,lr
div16s
CMP a1,#0
ADDLT a1,a1,#&f
MOV a1,a1,ASR #4
MOV pc,lr
从上面的例子可以看出,无符号除法的运算速度快于有符号除法。
14.2.3 求余运算
为了避免在程序中使用除法运算,可以将一些典型的求余运算进行转换。下面的例子提供一种转换方法。
uint counter1 (uint count)
{ return (++count % 60);
}
转换成,
uint counter2 (uint count)
{ if (++count 》= 60)
count = 0;
return (count);
}
下面是两个功能函数编译后的汇编代码。
counter1
STMDB sp!,{lr}
ADD a2,a1,#1
MOV a1,#&3c
BL __rt_udiv
MOV a1,a2
LDMIA sp!,{pc}
counter2
ADD a1,a1,#1
CMP a1,#&3c
MOVCS a1,#0
MOV pc,lr
上面的例子清晰的显示了使用if语句代替除法运算后,代码的执行效率有很大提高。
14.2.4 除数是常数的除法
因为除法和模运算执行起来比较慢,所以应该尽可能地避免使用。但是除数是常数的除法运算和用同一个除数的重复除法,执行效率会比较高。在ARM的除法库中,存在除数为10的除法运算库,其中包括有符号除法和无符号除法。如果除数是10以外的其他常数,用户可以编写自己的功能函数。ARM的开发工具集中,提供了关于除数是常数的示例程序和算法分析,以供用户编写自己的代码时参考。
下载该资料的人也在下载
下载该资料的人还在阅读
更多 >
- LabViEW编程之VI服务器综述 25次下载
- Windows编程之数据类型综述 5次下载
- Windows编程之数值运算综述 5次下载
- C++程序设计教程之运算符重载的详细资料说明 4次下载
- C语言教程之数据类型与运算符的详细资料说明 8次下载
- C语言实用教程之数据类型运算符和表达式的详细资料说明 10次下载
- C语言入门基础教程之函数的详细资料说明 6次下载
- MATLAB教程之数组和矩阵的介绍及运算说明 0次下载
- LINUX系统教程之如何在Linux系统下进行编程 9次下载
- C#入门教程之面向对象编程简介的详细资料概述 35次下载
- 单片机教程之如何进行单片机内部资源的C51编程 21次下载
- C语言程序设计教程之基本数据类型、运算符和表达式的详细资料概述 30次下载
- 高效的C编程之:浮点运算 1次下载
- C语言教程之平方和运算的问题 0次下载
- 定点DSP除法原理及其TMS320C6000 实现
- 基于FPGA的高效除法器设计 2k次阅读
- 技术干货驿站 ▏解锁C语言高效编程秘诀:深入解析运算符与优先级 1.1k次阅读
- 技术干货驿站 ▏深入理解C语言:编程高手必备,全方位解析运算符的核心技能! 1.5k次阅读
- C语言编程的七大陷阱与高效避坑指南 1.3k次阅读
- FPGA基于线性迭代法的除法器设计 2.2k次阅读
- C语言的运算符 2.1k次阅读
- 利用DS16C32/DS80C390加速80/400位数学运算 2.2k次阅读
- NI Multisim 10经典教程分享--除法与开平方运算电路 3.8k次阅读
- 四款常见的除法电路图分享 2.2w次阅读
- 介绍一种即省时又节约资源的乘除法算法 6.7k次阅读
- 几招教你编写高效简洁的C语言代码 2w次阅读
- 一文读懂FPGA中的除法运算及初识AXI总线 5.1k次阅读
- 除法运算电路设计方案汇总(九款模拟电路设计原理详解) 6.2w次阅读
- pic单片机io口控制教程之c语言编程实现 1.2w次阅读
- 一种模拟除法器的设计及仿真验证CMOS工艺 5.8k次阅读
下载排行
本周
- 1MDD品牌三极管BC807数据手册
- 3.00 MB | 次下载 | 免费
- 2MDD品牌三极管BC817数据手册
- 2.51 MB | 次下载 | 免费
- 3MDD品牌三极管D882数据手册
- 3.49 MB | 次下载 | 免费
- 4MDD品牌三极管MMBT2222A数据手册
- 3.26 MB | 次下载 | 免费
- 5MDD品牌三极管MMBTA56数据手册
- 3.09 MB | 次下载 | 免费
- 6MDD品牌三极管MMBTA92数据手册
- 2.32 MB | 次下载 | 免费
- 7STM32G474 HRTIME PWM 丢波问题分析与解决
- 1.00 MB | 次下载 | 3 积分
- 8新能源电动汽车高压线束的铜铝连接解决方案
- 2.71 MB | 次下载 | 2 积分
本月
- 1爱华AIWA HS-J202维修手册
- 3.34 MB | 37次下载 | 免费
- 2PC5502负载均流控制电路数据手册
- 1.63 MB | 23次下载 | 免费
- 3NB-IoT芯片厂商的资料说明
- 0.31 MB | 22次下载 | 1 积分
- 4H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料
- 0.63 MB | 6次下载 | 1 积分
- 5UWB653Pro USB口测距通信定位模块规格书
- 838.47 KB | 5次下载 | 免费
- 6技嘉H110主板IT8628E_BX IO电路图资料
- 2.61 MB | 4次下载 | 1 积分
- 7苏泊尔DCL6907(即CHK-S007)单芯片电磁炉原理图资料
- 0.04 MB | 4次下载 | 1 积分
- 8苏泊尔DCL6909(即CHK-S009)单芯片电磁炉原理图资料
- 0.08 MB | 2次下载 | 1 积分
总榜
- 1matlab软件下载入口
- 未知 | 935137次下载 | 10 积分
- 2开源硬件-PMP21529.1-4 开关降压/升压双向直流/直流转换器 PCB layout 设计
- 1.48MB | 420064次下载 | 10 积分
- 3Altium DXP2002下载入口
- 未知 | 233089次下载 | 10 积分
- 4电路仿真软件multisim 10.0免费下载
- 340992 | 191439次下载 | 10 积分
- 5十天学会AVR单片机与C语言视频教程 下载
- 158M | 183353次下载 | 10 积分
- 6labview8.5下载
- 未知 | 81602次下载 | 10 积分
- 7Keil工具MDK-Arm免费下载
- 0.02 MB | 73822次下载 | 10 积分
- 8LabVIEW 8.6下载
- 未知 | 65991次下载 | 10 积分
电子发烧友App





创作
发文章
发帖
提问
发资料
发视频
上传资料赚积分
评论