0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Versal FPGA中的浮点计算单元DSPFP32介绍

傅里叶的猫 来源:傅里叶的猫 2024-02-22 09:22 次阅读

Versal FPGA最新DSP原语DSP58,它在最新的DSP48版本上已经有了许多改进,主要是从27x18有符号乘法器和48位后加法器增加到了27x24和58位。但除此之外,DSP58还有两种额外的操作模式,分别称为DSPCPLX和DSPFP32。本文将重点介绍其中的DSPFP32,它是一个硬化的浮点加法器和乘法器。

DSPFP32包括一个单精度浮点加法器和乘法器。它们可以独立使用,也可以组合为乘累加操作。

下图展示了DSPFP32的内部架构:

f0ef8b06-d117-11ee-a297-92fbcf53809c.png

DSPFP32在某种程度上类似于DSP58,真正的区别,除了使用单精度浮点数而不是定点数之外,还有两个输出FPA和FPM,而不仅仅是后加法器P端口,以及没有预加法器。这个图展示了FP32加法器和乘法器独立使用,颜色高亮表示实现805MHz最大可能速度所需的最小流水线数量。你基本上在每个DSP58中得到一个延迟为2的FP32加法器和一个延迟为3的乘法器。加法器的两个输入操作数的符号可以选择性地反转,这些操作数有多种选择,包括ZERO、C、D和PCIN输入,以及FPA输出本身,可以用来构建累加器。

PCIN/PCOUT级联链允许你级联多个DSPFP32加法器,构建超过两项的求和。如果你使用fabric routing将FPA输出外部连接到B输入,你可以在5个时钟周期的延迟下计算类似FPM=A*(C+D)的东西。 第二张图显示了FP32乘法器和加法器内部连接为MAC,因此可以在4个时钟周期的延迟下计算FPA=C+AB或FPA=FPA+AB。C和FPOPMODE输入路径中的可选额外流水线寄存器可用于补偿乘法器路径的额外延迟,以便整个MAC对所有数据输入的总延迟为4个时钟周期。

f1185464-d117-11ee-a297-92fbcf53809c.png

虽然这些图中没有显示,但FPA和FPM都可以路由到PCOUT端口,因此使用P级联输出从相邻的DSP借用一个乘法器,你也可以在四个时钟周期的延迟内计算FPA=C+A1B1+A2B2,因此可以用4个DSPFP32和没有其他fabric资源构建一个完整的复数乘法器加一个复数加法器。

在早期的FPGA系列中,浮点设计总是可能的,Xilinx多年来一直提供基于fabric的软浮点IP,但硬化的DSPFP32现在提供了使用单个DSP58原语和几乎没有fabric资源的选项,具有更低的延迟(3-4个时钟周期而不是8-11个),更低的功耗和高达805MHz的时钟速度,在最快的两个速度等级中。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1629

    文章

    21729

    浏览量

    602986
  • 寄存器
    +关注

    关注

    31

    文章

    5336

    浏览量

    120230
  • 加法器
    +关注

    关注

    6

    文章

    183

    浏览量

    30114
  • FPM
    FPM
    +关注

    关注

    0

    文章

    5

    浏览量

    1286

原文标题:Versal FPGA中的浮点计算单元

文章出处:【微信号:傅里叶的猫,微信公众号:傅里叶的猫】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    DS1302介绍

    DS1302介绍一款高性能、低功耗的日历时钟DS1302是一种串行接口的实时时钟,内部有可编程的日历时钟和31个字节的静态RAM,可以自动进行闰年补偿工作电压范围宽(2.5V~5.5V),还有对备用
    发表于 07-19 06:59

    EFR32介绍

    EFR32介绍EFR32 Mighty Gecko ZigBee 和 Thread 的 SoC 系列是无线 Gecko 产品系列的组成部分。 Mighty Gecko SoC 是实现 IoT 设备
    发表于 07-23 06:21

    ISO14443介绍

    内容提纲1、ISO14443介绍-了解2、14443-A帧格式-掌握3、唤醒、防冲突、选卡-掌握认识14443ISO14443协议:ISO14443协议是Contactless card
    发表于 07-27 07:10

    FDC2214介绍

    一、FDC2214介绍(1)这个图片截自FDC2214的数据手册,可以看出FDC2214与MCU之前的通讯是靠I2C协议来完成的,该芯片的外围电路设计在手册已给出。(2)该模块I2C接口最大速度为
    发表于 08-12 08:10

    LCD1602介绍

    World」。1. LCD1602介绍对于单片机爱好者和电子爱好者来说,或多或少都曾使用过液晶显示模块。它们都是由若干个点阵字符位组成的,根据显示内容可分为1602、12864等。LCD1602可...
    发表于 03-01 07:33

    STM32F4浮点单元介绍

    固定/浮点的实用介绍浮点单元的实用介绍  关于浮点用法的提示和评论
    发表于 09-12 08:27

    温度传感器 LM35介绍

    温度传感器 LM35介绍 在自动控制、机电整合的应用,温度的测量为
    发表于 12-02 10:28 2.9w次阅读

    功率计量芯片HLW8012介绍及应用

    功率计量芯片HLW8012介绍及应用 简单易用 使用方便 程序简单
    发表于 11-20 16:28 127次下载

    CP5612介绍安装调试驱动说明

    CP5612介绍安装调试驱动说明~~~~~~~~~~~~~~~
    发表于 06-08 15:13 9次下载

    MultiSIM9介绍和虚拟仪器使用

    MultiSIM9介绍和虚拟仪器使用
    发表于 03-28 10:20 3次下载

    浮点运算单元FPGA实现

    ,其速度直接影响DSP的速度,因此国内外学者对提高浮点乘加单元的性能进行了大量的研究。浮点运算单元的设计主要是在速度和所占用资源之间进行权衡。 本文以实时信号处理为应用背景,首先
    发表于 04-10 10:47 8次下载
    <b class='flag-5'>浮点</b>运算<b class='flag-5'>单元</b>的<b class='flag-5'>FPGA</b>实现

    IAR for STM8介绍、 下载、安装与注册

    IAR for STM8介绍、下载、安装与注册
    的头像 发表于 03-20 11:42 4742次阅读
    IAR for STM8<b class='flag-5'>介绍</b>、 下载、安装与注册

    如何在FPGA上实现复数浮点计算

    高性能浮点处理一直与高性能 CPU 相关联。在过去几年中,GPU 也成为功能强大的浮点处理平台,超越了图形,称为 GPGPU(通用图形处理单元)。新创新是在苛刻的应用实现基于
    发表于 12-22 13:33 14次下载

    STM32U5介绍

    电子发烧友网站提供《STM32U5介绍.pdf》资料免费下载
    发表于 09-19 15:06 0次下载
    STM32U5<b class='flag-5'>介绍</b>

    M7介绍_20210615

    电子发烧友网站提供《M7介绍_20210615.pdf》资料免费下载
    发表于 08-31 16:06 6次下载