0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Xilinx DSP slices 实现 SDF 流水 FFT Core

C29F_xilinx_inc 来源:互联网 作者:佚名 2017-09-19 11:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

背景:

快速傅里叶变换(FFT)在雷达、通信和电子对抗等领域有广泛应用。近年来随着现场可编程门阵列(FPGA)的飞速发展,与DSP技术相比,由于其并行信号处理结构,使得FPGA能够很好地适用于高速信号处理系统,但是,由于Altera等公司研制的FFT IP核,价钱昂贵,不适合大规模应用,在特定领域中,设计适合于自己领域需要的FFT处理器是较为实际的选择,下面将关注一些关于流水级FFT处理器的一些最新发展。

SDF FFT Core → FPGA DSP slice:

近期,在IEEE VLSI系统专栏学报处有一篇12页的题为“Efficient FPGA Mapping of Pipeline SDF FFT Cores”的新论文即将被发表(在IEEE Xplore可见)。而在这篇论文中作者就如何将一个SDF(single-path delay feedback单路延迟反馈)FFT核映射到Xilinx的全可编程芯片内部的DSP48 slices的可编程逻辑及其他可用的存储资源上进行了深入周密的细节性讨论。尽管这篇论文主要是针对Virtex-4和Virtex-6系列FPGA进行讨论的,但是作者也明确指出,由于Xilinx 7系列和UltraScale/UltraScale+ 系列FPGA与Virtex-6使用相同的slice 架构,所以这种映射其实很容易被推广的。

在论文中,作者详细阐述了Xilinx的产品,主要是从Virtex-4 FPGA开始到Xilinx后来的所有全可编程芯片等多代产品内部的DSP48 slices的一个发展过程:首先,Virtex-4 FPGA系列包含一18X18bit乘法器和48bit累加器的XtremeDSP(DSP48);之后的Virtex-6系列FPGA加入了25x18bit乘法器和48bit累加器的DSP48 slices ;较新的7系列FPGA和Zynq-7000系列SoC则内嵌了25x18bit乘法器和48bit累加器的DSP48 slices;而最强的UltraScale/UltraScale+系列FPGA则包括了27x18bit乘法器和48bit加法器的DSP48E2。除此之外,在Xilinx每一代FPGA的DSP48 slices的发展中都有很多额外的改进,比如时钟率具有较稳定的提高,也正是这么多代产品的不断迭代,才使得现在的DSP48E2 功能更加强大。下图是论文中作者提到的关于DSP48E2 功能实现的细节。

图1 DSP48E2 功能细节

同时,在这片IEEE的论文中还讨论了如何将此FFT核蝶形转换到较少的LUT单元中,而如何有效转换关系到是否可以实现DSP48 preadders的蝶形地址,在实现过程中,通过将有效的数据映射和转换因子存储到BRAM 及分布式存储资源中,有效地完成 radix-2k算法转换因子的共享,此外采用重新定时和流水的方式来缩短实现时间。

虽然这篇博客展示的任何技术都是来自于论文中,读者也可以从IEEE论文网站得到,但是还是会给出论文中的一些结论(以便可以提起您去检索并阅读全文的兴趣):“报告的实现结果表明,相比于之前的有关实现而言,通过利用Virtex-4和Virtex-6内部的DSP48实现一个FFT核,可以使其性能分别提高350%到400%,同时,还可以获得一个更高的混合时钟频率,并且整个实现过程只需要更少的存储资源。这也正好如以前发表过的最好的报告结果一样,都是使用完全一样的架构,使用同Virtex-4完全一样的算法,也体现出这种转换的优势十分明显,所以,为提高性能,可以尝试将架构映射到FPGA硬件结构中来实现。

总结:

在目前的市场中,尤其是一些互联网公司,都开始利用FPGA做硬件加速的实现,不仅是因为FPGA的可用性,更主要的是各大公司都看中了硬件实现软件算法时对整个算法质量的极大提升,这类市场也恰好是我们Xilinx未来竞争的关键点所在。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Xilinx
    +关注

    关注

    73

    文章

    2205

    浏览量

    131825
  • FFT
    FFT
    +关注

    关注

    15

    文章

    458

    浏览量

    63216

原文标题:性能飞升350%~400%!Xilinx DSP slices 实现 SDF 流水 FFT Core

文章出处:【微信号:xilinx_inc,微信公众号:赛灵思】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探索NXP MMC2114和MMC2113 M•CORE微控制器的卓越性能

    CORE M210中央处理器单元(CPU),这是一种高度紧凑的32位核心实现。其采用流水线式精简指令集计算机(RISC)执行单元,使用16位指令,在节省片上内存资源的
    的头像 发表于 04-10 11:30 165次阅读

    fft算法c语言的实现

    问题之前我烦恼了一会儿,但别忘了。 前者的展开是N/2,因为此时n是奇偶校验分离的,是从根据的可约束性得出的,在此不能混淆。 没有必要提到计算效率。 m级计算总共需要: FFT c语言实现 FFT算法
    发表于 01-27 06:10

    详解FFT的频率仓与IP核配置

    FFT 的输出不是 “连续的频率谱”,而是离散的、等宽的频率区间,每个区间就称为一个 “频率仓”(简称 “仓”)。可以类比为:把 “0Hz 到最高可测频率” 的范围分成了 N 个并排的 “箱子
    的头像 发表于 01-26 16:58 384次阅读
    详解<b class='flag-5'>FFT</b>的频率仓与IP核配置

    FFT算法原理详解

    /* 功能:将input里的数据进行快速傅里叶变换 并且输出 */ #include #include #define FFT_LENGTH 8 double input[FFT
    发表于 01-22 06:36

    利用arm-DSP库进行FFT的计算

    电力系统中往往掺杂谐波,而FFT可以将谐波检测出来,具有较大的实用价值。今天主要讲一下在STM32中如何利用dsp库进行快速傅里叶计算,从而得出信号的频谱幅值以及相位。 一、Matlab简单搭建1.
    发表于 01-21 08:19

    Air780EPM开发板上的FFT应用实现:关键技术深度剖析

    以Air780EPM开发板为硬件平台,快速傅里叶变换(FFT)的应用实现成为嵌入式信号处理中的关键环节。本文将围绕该开发板的硬件适配特性、FFT算法在嵌入式环境中的部署流程,深入解析代码结构、关键
    的头像 发表于 12-30 14:33 379次阅读
    Air780EPM开发板上的<b class='flag-5'>FFT</b>应用<b class='flag-5'>实现</b>:关键技术深度剖析

    以Air780EPM开发板为例:FFT应用示例核心要点全解析

    以Air780EPM开发板作为实践载体,本文将对FFT应用示例的核心要点展开全面解析。从开发板的硬件特性适配、FFT算法的实现流程,到示例代码的核心模块与调试要点,逐一拆解,确保开发者能精准把握
    的头像 发表于 12-16 15:28 453次阅读
    以Air780EPM开发板为例:<b class='flag-5'>FFT</b>应用示例核心要点全解析

    泰克示波器FFT功能详解

    在电子信号分析中,频谱分析是揭示信号本质的重要手段。泰克示波器的FFT(快速傅里叶变换)功能,将时域信号转化为频域信息,为工程师提供了洞察信号频率成分的“透视镜”。本文将深入解析泰克示波器FFT功能
    的头像 发表于 09-23 17:52 1435次阅读
    泰克示波器<b class='flag-5'>FFT</b>功能详解

    【作品合集】中科昊芯Core_DSC280025C开发板测评

    中科昊芯Core_DSC280025C开发板测评作品合集 产品介绍: Core_DSC280025C核心板使用了昊芯HXS320F28025CRISC-V DSP芯片,该芯片集成了吴芯自主研发
    发表于 09-18 10:52

    Tektronix泰克MDO32示波器FFT功能使用指南

    一、引言 在电子工程与信号分析领域,快速傅里叶变换(FFT)是分析复杂信号频谱特性的核心工具。泰克MDO32示波器作为一款高性能混合域示波器,其内置的FFT功能为用户提供了强大的频谱分析能力,可广泛
    的头像 发表于 08-18 17:02 1234次阅读
    Tektronix泰克MDO32示波器<b class='flag-5'>FFT</b>功能使用指南

    DFT算法与FFT算法的优劣分析

    一概述 在谐波分析仪中,我们常常提到的两个词语,就是DFT算法与FFT算法,那么一款功率分析仪/谐波分析仪采用DFT算法或者FFT算法,用户往往关注的是能否达到所要分析谐波次数的目的,而并未考虑两种
    的头像 发表于 08-04 09:30 1749次阅读

    STM32多通道FFT运算异常的原因?怎么解决?

    CMSIS-DSP使用多次FFT时,是否需特别注意堆栈或缓存的分配方式? 是否有推荐的多通道FFT结构优化方式(如分时处理、DMA双缓冲配合FFT
    发表于 06-19 06:27

    泰克TBS1102X示波器FFT功能使用指南

    泰克TBS1102X示波器作为电子测量领域的经典设备,其内置的快速傅里叶变换(FFT)功能为工程师和技术人员提供了强大的频域分析能力。通过FFT功能,用户能够将时域信号转换为频谱图,从而精准分析信号
    的头像 发表于 05-26 17:10 1477次阅读
    泰克TBS1102X示波器<b class='flag-5'>FFT</b>功能使用指南

    泰克示波器TBS2204B的FFT分析功能设置指南

    在电子测试与信号分析领域,快速傅里叶变换(FFT)是解析信号频域特性的核心工具。泰克示波器TBS2204B作为一款高性能4通道数字示波器,其内置的FFT分析功能可帮助用户深入探索信号的频谱分布、频率
    的头像 发表于 05-16 17:45 1475次阅读
    泰克示波器TBS2204B的<b class='flag-5'>FFT</b>分析功能设置指南

    Xilinx Shift RAM IP概述和主要功能

    Xilinx Shift RAM IP 是 AMD Xilinx 提供的一个 LogiCORE IP 核,用于在 FPGA 中实现高效的移位寄存器(Shift Register)。该 IP 核利用
    的头像 发表于 05-14 09:36 1253次阅读