资料介绍
数字信号处理器(Digital Signal Processor.DSP)从专用信号处理器开始发展到今天的超长指令字( Very Long Instruction Word.VLIW)阵列处理器,其应用领域已经从最初的语音、声纳等低频信号的处理发展到今天雷达、图像等视频大数据量的信号处理。由于浮点运算和并行处理技术的应用,信号处理能力已得到极大的提高。随着数字信号处理器在处理速度和运算精度两个方向的发展,体系结构中数据流结构甚至人工神经网络结构等,将可能成为下一代数字信号处理器的基本结构模式。近些年,从传统DSP结构中已不能有效地提高DSP处理器的性能,许多新的提高DSP性能的方法被提出。其中提高频率的方法已达到瓶颈阶段,最有效的途径是提高并行性。数字信号处理领域的核心算法根据运算类型可以分为两大类:一类是以密集的浮点乘加运算为典型的信号处理算法,包括快速傅里叶变换( Fast Fourier Transformation,FFT)、有限冲激响应( Finite Impulse Response,FIR)和离散傅里叶变换(Discrete Fourier Transform, DFT)等算法;另一类足以密集的复数矩阵操作为主的算法,包括信道估计和多输入多输出( Multiple-Input Multiple-Output,MIMO)均衡等算法。这两类算法均需要DSP处理器提供较高的浮点乘加运算的计算性能。第一类算法主要是进行乘加运算(a*b+c),第二类算法主要进行大量的复数矩阵乘和矩阵求逆等运算,而在这些运算中都存在密集的乘后加运算(a*c+c*d)浮点乘累加器(Floating-point Multiply ACcumulate.FMAC)已经成为提高并行计算以减少计算延时的有效方法,其运算能力已经成为衡量数字信号处理器DSP性能的一个重要特征。
浮点乘加结构已被研究多年,IBM学者Montoye和Hokenek于1990年最先提出了融合乘加的概念,即将乘法和加法融合成一条指令执行,并将加法操作融合在乘法的部分积压缩阵列中,从而减少硬件开销和延时;这种乘加结构的主要缺点是求和尾数长且结果尾数舍入延时长。Lang等于2004年提出了低延时融合乘加结构,这种结构采用前导零预测( Leading Zero Anticipation,LZA),将尾数舍入和加法合并,并在尾数加法之前进行规格化移位。目前大多数处理器中的浮点乘加设计实现均采用这种技术,为进一步提高浮点融合乘加结构的并行度以提升浮点乘加器的性能,Lang等于2005年设计了双通路浮点融合乘加结构,该乘加结构主要优点是延时更低、处理性能得到进一步提高;但该乘加结构逻辑设计复杂,硬件资源消耗大。国防科技大学研制的vr-XDSP中设计了多功能快速浮点融合乘加运算单元,但该设计硬件资源消耗太多,功耗过大。
本文基于高性能计算的应用需求,以M型数字信号处理器( M-DSP)为研究背景,深入研究FMAC的各功能模块和流水线结构,对已有浮点融合乘加结构p1的关键模块和算法进行了研究与优化,设计了6级流水线结构的FMAC单元,可支持双精度和单精度浮点乘法、乘累加、乘累减、单精度点积和复数运算。对所设计的FMAC单元的寄存器传送语言(Register Transfer Language,RTL)代码实现迸行了仿真测试,并基于45 nm工艺采用Synopsys公司的DC( Design Compiler)对硬件实现进行了综合,运行频率可达1 GHz。
- 51单片机中累加器A与ACC的区别
- DSP和普通的MCU或者SOC区别小结
- 浮点DSP运算效率不高 10次下载
- Arduino的累加器实验程序和工程文件免费下载 5次下载
- 32位数字相位累加器的程序和工程文件免费下载 8次下载
- C8051F系列51单片机的指令详解
- 基于PIC32MK通用和电机控制应用MCU
- 浮点运算单元的FPGA实现 8次下载
- DSP基础知识集锦之当前DSP产品的主要特点 10次下载
- 浮点 DSP 运算效率不高 0次下载
- MAC在FPGA中的高效实现
- 新型应用受益于浮点DSP的高精度
- RISC乘累加单元的扩展Extended RISC MAC
- 定点dsp浮点运算教程
- DSP的浮点运算方法
- SIMATIC S7-1500 PLC右移指令(SHR)简述 3422次阅读
- 如何使用功率累加器进行实时功率测量 1563次阅读
- 震惊!FPGA运算单元可支持高算力浮点 1711次阅读
- 定点DSP C55x音频专用处理器嵌入式教学 2838次阅读
- 基于TI TMS320C6748定点/浮点DSP C674x处理器 2991次阅读
- 寄存器、累加器、暂存器有什么区别 5217次阅读
- 相位累加器原理及累加器代码 8047次阅读
- 简析DSP的工作原理 1.3w次阅读
- 区块链RSA累加器批处理技术解析 3375次阅读
- PIC32MZ EF系列处理器主要特性及开发板框图 4194次阅读
- 累加器A的主要作用是什么_一文解析累加器a和acc的区别 2.2w次阅读
- 累加器是寄存器吗_寄存器、累加器、暂存器有什么区别 9392次阅读
- 单片机累加器作用_单片机复位电路的作用 1.1w次阅读
- 累加器是什么_累加器的作用及原理介绍 7.2w次阅读
- 14位模数ADC+20位突发累加器的ADI手势识别传感器方案 1918次阅读
下载排行
本周
- 1电子电路原理第七版PDF电子教材免费下载
- 0.00 MB | 1490次下载 | 免费
- 2单片机典型实例介绍
- 18.19 MB | 93次下载 | 1 积分
- 3S7-200PLC编程实例详细资料
- 1.17 MB | 27次下载 | 1 积分
- 4笔记本电脑主板的元件识别和讲解说明
- 4.28 MB | 18次下载 | 4 积分
- 5开关电源原理及各功能电路详解
- 0.38 MB | 10次下载 | 免费
- 6基于AT89C2051/4051单片机编程器的实验
- 0.11 MB | 4次下载 | 免费
- 7基于单片机和 SG3525的程控开关电源设计
- 0.23 MB | 3次下载 | 免费
- 8基于单片机的红外风扇遥控
- 0.23 MB | 3次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 2PADS 9.0 2009最新版 -下载
- 0.00 MB | 66304次下载 | 免费
- 3protel99下载protel99软件下载(中文版)
- 0.00 MB | 51209次下载 | 免费
- 4LabView 8.0 专业版下载 (3CD完整版)
- 0.00 MB | 51043次下载 | 免费
- 5555集成电路应用800例(新编版)
- 0.00 MB | 33562次下载 | 免费
- 6接口电路图大全
- 未知 | 30320次下载 | 免费
- 7Multisim 10下载Multisim 10 中文版
- 0.00 MB | 28588次下载 | 免费
- 8开关电源设计实例指南
- 未知 | 21539次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935053次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537791次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420026次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191183次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183277次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138039次下载 | 免费
评论
查看更多