0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为何CPU主频比FPGA快还要说可以帮助CPU加速?

FPGA开源工作室 来源:OpenIC 作者:温戈 2021-06-30 10:57 次阅读

主频只是影响计算速度的一个因素,并不是全部。在执行一些计算密集型的任务场景中,FPGA的计算速度是更快的,目前FPGA作为CPU的协处理器已经广泛应用在IntelAMD公司产品中。

CPU、GPU、和FPGA的比较

桌面端的CPU为冯诺依曼结构,从上图可以看出,其基本组成为控制器,Cache,和ALU。而计算单元ALU在CPU中的占比不大,所以它的并行计算能力有限。

中间的为GPU,绿色的计算单元占了绝大部分,所以并行计算能力很强。

弱点是控制能力很弱,Cache小,为了保证计算能力,就需要大量的高速DDR保证数据吞吐率。

右侧为FPGA,包含可编程的I/O、DSP、memory、PCIE等,因为大量存储单元的存在,FPGA在做计算的时候可以直接从内部存储单元读取数据。

推荐一个国外的FPGA学习网站 -- fpga4fun,里边有FPGA的介绍及26个实战项目及实现代码,非常适合入门学习!

https://www.fpga4fun.com/

正因为CPU、GPU、和FPGA在结构上的不同,也让他们在实际应用层面有所侧重。

目前主流的方案是把CPU、GPU和FPGA都集成在一个SoC中,通过片内总线互联。在执行并行计算的时候,比如进行图像处理,FPGA的优势就体现出来了,通过协作分工,使芯片的工作效率最大化。

目前的3D封装以及chiplet等技术为这样的组合提供了可实现性。

为什么FPGA计算速度会比CPU更快?

在执行大量的运算场景中,FPGA相比GPU的核心优势在于低延迟。FPGA比CPU延迟低,在本质上是体系结构的区别。FPGA同时拥有流水线并行和数据并行,而CPU几乎只有数据并行,虽然也会才有流水线设计,但深度受限。因此,FPGA 更适合做需要低延迟的流式处理,GPU 更适合做大批量同构数据的处理。

举个例子:

我们有四个全加器,每一个的进为输出连接到下一个的进位输入,这样实现的加法器被称作行波进位加法器(Ripple-Carry Adder, RCA)。其特点为:

结构特点:低位全加器的Cout连接到高一位全加器Cin

优点:电路布局简单,设计方便

缺点:高位的运算必须等待低位的运算完成

我们来看一下其关键路径的延迟:

总延迟时间:(T + T)*4 + T = 9T,推广到n位,总时间为(2n + 1)*T。

每一个全加器计算的时候必须等待它的进位输入产生后才能计算,所以四个全加器并不是同时进行计算的,而是一个一个的串行计算。这样会造成较大的延迟。

我们把这个电路改进一下:提前计算出“进位信号”,对进位信号进行分析。

这样我们就得到了一个:超前进位加法器(Carry-Lookahead Adder, CLA)

其中,C1、C2、C3、C4都由下面的电路计算好,需要3级门延迟,然后在全加器中关键路径上还有1级延迟

所以,总共有4级门延迟。

如果采用这种完全的超前进位,理论上的门延迟都是4级门延迟。

实际电路过于复杂,难以实现(C31需要32位的与门和或门!)

通常的方法:采用多个小规模的超前进位加法器拼接而成,例如,用4个8-bit的超前进位加法器连接成32-bit加法器。

所以我们需要更多的计算位宽或者更大的数组,或者矩阵的运算的时候,我们使用FPGA的优势就体现出来。再多的计算,也就是放置更多的硬件逻辑资源。

FPGA对CPU加速场景

在一些特定的应用场景下,单独使用CPU和CPU+FPGA两种方案所需处理时间的对比,可见FPGA对CPU的加速效果非常明显,甚至比单独使用CPU高出1~2个数量级!

FPGA的缺点

FPGA也是有缺点的,其中之一便是开发周期长。其需要对特定的应用编写特定的FPGA。只要干的事情稍有不同,一般来说FPGA代码就要重新写一遍或者是至少要修改很多东西。如果要做的事情复杂、重复性不强,就会占用大量的逻辑资源,其中的大部分处于闲置状态。

不过,Chiplet的应用对对FPGA的开发周期有一定的优化,以下是传统FPGA开发的周期和应用chiplet的开发周期对比:

未来的方向

在现在的SoC设计中,要充分考虑不同模块的特点,FPGA 和 CPU 协同工作,充分发挥各自的长处,局部性和重复性强的归 FPGA,复杂的归 CPU。从而达到整个系统算力的最优化。

在未来,FPGA会作为协处理器和CPU、GPU共存一段时间,其主要提供以下三方面的能力:

能够提供专门的硬件加速,实现各种应用中需要的关键处理功能。

FPGA设计在性能上非常灵活,使用流水线和并行结构,适应对性能的需求变化。

协处理器能为主处理器和系统存储器提供宽带,低延迟接口

目前,英特尔,AMD,赛灵思等公司都把FPGA作为协处理器集成在SoC中作为实际应用的硬件加速解决方案,这样的设计也使得CPU和FPGA在未来的一段时间内会共存,互相配合,赋能各种计算场景。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1629

    文章

    21729

    浏览量

    602988
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10854

    浏览量

    211578
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4729

    浏览量

    128890

原文标题:为什么CPU主频一般都比FPGA快,但是却说FPGA可以帮助CPU加速?

文章出处:【微信号:leezym0317,微信公众号:FPGA开源工作室】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何限制容器可以使用的CPU资源

    默认情况下容器可以使用的主机 CPU 资源是不受限制的。和内存资源的使用一样,如果不对容器可以使用的 CPU 资源进行限制,一旦发生容器内程序异常使用
    的头像 发表于 10-24 17:04 216次阅读
    如何限制容器<b class='flag-5'>可以</b>使用的<b class='flag-5'>CPU</b>资源

    服务器cpu和台式机cpu区别

    服务器CPU和台式机CPU的区别是一个复杂的话题,涉及到多个方面,包括设计、性能、功耗、可靠性、成本等。 服务器CPU和台式机CPU的区别 1. 设计目标 服务器
    的头像 发表于 10-10 15:12 1136次阅读

    CPU主频是什么意思

    CPU主频,作为计算机处理器性能的一个重要指标,承载着丰富的技术内涵与实际应用价值。以下是对CPU主频的详细解析,包括其定义、用途、技术原理、影响因素以及在多个领域的实际应用。
    的头像 发表于 09-26 15:50 1511次阅读

    CPU时钟周期与主频的关系和区别

    CPU时钟周期与主频是计算机体系结构中两个紧密相连且至关重要的概念,它们之间既存在关系又有所区别。以下将详细阐述CPU时钟周期与主频的关系和区别。
    的头像 发表于 09-26 15:46 1614次阅读

    双核cpu和单核cpu的区别

    双核CPU与单核CPU在多个方面存在显著差异,这些差异主要体现在处理能力、性能、运行效率、功耗以及适用场景等方面。 一、概念与结构 双核CPU :指在一个处理器上集成两个运算核心,通过并行总线将各处
    的头像 发表于 09-24 16:17 2769次阅读

    什么是CPU缓存?它有哪些作用?

    CPU缓存(Cache Memory)是计算机系统中一个至关重要的组成部分,它位于CPU与内存之间,作为两者之间的临时存储器。CPU缓存的主要作用是减少CPU访问内存所需的时间,从而提
    的头像 发表于 08-22 14:54 2884次阅读

    多核CPU的优势是什么

    多核CPU(Central Processing Unit,中央处理器)作为现代计算机技术的重要里程碑,其优势在于显著提升了计算性能、多任务处理能力、系统稳定性以及能效等多个方面。以下将详细阐述多核CPU的几大优势,并结合相关
    的头像 发表于 08-22 14:30 2598次阅读

    JAVA应用CPU跳点自动DUMP工具

    背景 在做系统监控时,CPU的使用率是一个关键的指标,它反映了系统的性能稳定性以及是否存在异常情况,能帮助我们了解系统的负载情况。通过监控CPU使用率,可以判断系统是否正常运行或者是否
    的头像 发表于 08-05 17:48 523次阅读

    英特尔助力京东云用CPU加速AI推理,以大模型构建数智化供应链

    英特尔助力京东云用CPU加速AI推理,以大模型构建数智化供应链
    的头像 发表于 05-27 11:50 529次阅读
    英特尔助力京东云用<b class='flag-5'>CPU</b><b class='flag-5'>加速</b>AI推理,以大模型构建数智化供应链

    CPU的各种知识

    1、CPU的位和字长位:在数字电路和电脑技术中采用二进制,代码只有“0”和“1”,其中无论是“0”或是“1”在CPU中都是一“位”。字长:电脑技术中对CPU在单位时间内(同一时间)能一次处理的二进制
    的头像 发表于 04-19 08:26 478次阅读
    <b class='flag-5'>CPU</b>的各种知识

    请问DMA控制器可以减轻CPU负担吗?

    直接存储器访问 ( DMA )控制器,可以在内存和/或外设之间传输数据,而不需要 CPU 参与每次传输。合理利用 DMA 控制器,可以减轻CPU的负担。
    的头像 发表于 03-28 09:41 707次阅读
    请问DMA控制器<b class='flag-5'>可以</b>减轻<b class='flag-5'>CPU</b>负担吗?

    什么是cpu主频和外频,它们之间关系如何

    CPU主频和外频是计算机中两个重要的频率指标,它们分别代表了CPU内部和与外部组件之间的数据传输速率。这两个频率指标之间有着密切的关系,对计算机的性能和稳定性有着重要的影响。 首先,我们来具体了解
    的头像 发表于 02-03 16:50 4121次阅读

    服务器cpu和普通电脑cpu的区别

    服务器CPU和普通电脑CPU之间存在许多区别。在以下文章中,我们将详细介绍服务器CPU和普通电脑CPU之间的区别,并探讨它们在性能、稳定性、扩展性、功耗和可靠性方面的差异。 一、性能
    的头像 发表于 02-01 11:14 6633次阅读

    为什么GPUCPU更快?

    GPUCPU更快的原因并行处理能力:GPU可以同时处理多个任务和数据,而CPU通常只能一次处理一项任务。这是因为GPU的架构使得它可以同时
    的头像 发表于 01-26 08:30 2394次阅读
    为什么GPU<b class='flag-5'>比</b><b class='flag-5'>CPU</b>更快?

    如何能够实现通用FPGA问题?

    FPGA 是一种伪通用计算加速器,与 GPGPU(通用 GPU)类似,FPGA 可以很好地卸载特定类型的计算。从编程角度上讲,FPGA
    发表于 12-29 10:29 459次阅读