0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据处理单元DPU能够处理GPU做不了的任务吗?

SDNLAB 来源:SDNLAB 2023-02-02 10:44 次阅读

很长一段时间以来,中央处理器CPU)和图形处理单元(GPU)一直“统治”着数据中心。然而,近几年,数据处理单元(DPU)越来越多地出现在大家面前,并号称性能更强大、更专用、更异构,能够处理CPU做不好,GPU做不了的任务,那事实究竟如何,一起看下去吧。

CPU

CPU—— Central Processing Unit, 中央处理器,CPU之于计算机、服务器,也就相当于大脑对于人类的作用。

计算、控制、存储是CPU“大脑”布局谋略、发号施令、控制行动的主要表现形式。

CPU 是对计算机的所有硬件资源(如存储器、输入输出单元) 进行控制调配、执行通用运算的核心硬件单元,是计算机的运算和控制核心。

CPU主要包括了运算器(ALU, Arithmetic and Logic Unit)、控制单元(CU, Control Unit)、寄存器(Register)、高速缓存器(Cache)和它们之间通讯的数据、控制及状态的总线。

总的来说也就是计算单元、控制单元和存储单元。

a7f52474-a242-11ed-bfe3-dac502259ad0.png

| CPU微架构示意图,来源:网络

#

控制单元

控制单元是整个CPU的指挥控制中心,由指令寄存器IR(Instruction Register)、指令译码器ID(Instruction Decoder)和操作控制器OC(Operation Controller)等构成,主要是对指令译码,并且发出为完成每条指令所要执行的各个操作的控制信号

#

计算单元

计算单元在CPU中很重要,主要负责算术和逻辑运算。相对控制单元而言,运算器接受控制单元的命令而进行动作,即运算单元所进行的全部操作都是由控制单元发出的控制信号来指挥的。

#

存储单元

存储单元包括CPU片内缓存和寄存器组,是CPU中暂时存放数据的地方,里面保存着那些等待处理的数据,或已经处理过的数据,CPU访问寄存器所用的时间要比访问内存的时间短。采用寄存器可以减少CPU访问内存的次数,从而提高了CPU的工作速度。但因为受到芯片面积和集成度所限,寄存器组的容量不可能很大。

相对于控制单元和存储单元,CPU的计算单元在整个结构中占比较少,故而相对于大规模并行计算能力,CPU更擅长于逻辑控制、串行运算。

下图展示了一个基础的CPU架构。以个人电脑的CPU为例,CPU 往往与内存 (RAM)、硬盘驱动器和 NIC(网络接口控制器)相连,如果你想要打游戏或者处理图像/视频,那就需要添加GPU;如果想要更快地访问内存,那可以选择添加 SSD

a807f784-a242-11ed-bfe3-dac502259ad0.png

| CPU架构,来源:StatusNeo

普通个人电脑中的 CPU往往在4到8核,频率在2到3GHz。数据中心的 CPU 往往有更多的核心和更高的时钟速度。CPU 的核心较少但功能强大,而GPU可以有很多核心,但在时钟速度方面的能力更弱。

GPU

GPU——Graphics Processing Unit,图形处理器,跟它的名字一样,GPU最初是用在个人电脑、游戏机和一些移动设备上运行绘图运算工作的微处理器

理解 GPU 和 CPU 之间区别的一种简单方式是比较它们如何处理任务。

CPU 由专为顺序串行处理而优化的几个核心组成,而 GPU 则拥有一个由数以千计的更小、更高效的核心组成的大规模并行计算架构。

GPU的构成相对简单,有数量众多的计算单元和超长的流水线,特别适合处理大量的类型统一的数据。

a82c49d6-a242-11ed-bfe3-dac502259ad0.png

| GPU微架构示意图,来源:网络

当涉及算术运算和逻辑运算等常规计算时,通常是CPU更快,但是当涉及到大型矩阵乘法和并行算法时,GPU 排在第一位。GPU 拥有数千个内核并行进行运算,这些内核的时钟速度较低或内核较弱,但在并行计算中效率很高,并且每个核心都有自己的 ALU。

不过GPU不能单独工作,需要CPU的协同处理。

GPU的工作大部分计算量庞大,但没什么技术含量,而且要重复很多很多次。当CPU需要大量的处理类型统一的数据时,就可以调用GPU进行并行计算。

尽管GPU叫图形处理器,但它并不是只能处理图像。

GPU虽然是为了图像处理而生,但在结构上并没有专门为图像服务的部件,只对CPU的结构进行了优化与调整。

GPU基于大吞吐量设计,拥有更多的ALU,适合对密集数据进行并行处理,擅长大规模并发计算,因此GPU也被应用于深度学习神经网络人工智能等需要大规模并发计算场景。

GPU可以被认为是一种较通用的芯片。

a844a170-a242-11ed-bfe3-dac502259ad0.png

| GPU架构,来源:StatusNeo

FPGA

FPGA——Field Programmable Gate Array,现场可编程门阵列,本质上它是一种硬件,可以根据用户的需要进行多次编程。

简单地说,FPGA可以用来实现任何逻辑功能。与GPU或 ASIC(Application Specific Integrated Circuit,专用集成电路)不同,FPGA 芯片内部的电路不是硬蚀刻的——它可以根据需要重新编程。这种能力使 FPGA 成为 ASIC 的绝佳替代品,不过ASIC 通常需要较长的开发时间和大量的设计和制造投资。

a8ffb24e-a242-11ed-bfe3-dac502259ad0.png

| FPGA架构,来源:网络

与 GPU 相比,FPGA 可以在需要低延迟的深度学习应用中提供卓越的性能。可以对 FPGA 进行微调,以平衡功率效率和性能要求。当应用程序需要低延迟和小批量时,FPGA 可以提供优于 GPU 的性能优势。

DPU

DPU—— Data Processing Unit ,数据处理单元,DPU是面向数据中心的专用处理器。

在计算架构中,CPU 具有多重职责,例如运行应用程序、执行计算,同时它还扮演着数据流量控制器的角色,在 GPU、存储、FPGA和其他设备之间移动数据,因此 CPU 更加以计算为中心。

随着数据中心建设、网络带宽和数据量急剧增长,由于CPU性能增长速度放缓,为了寻求效率更高的计算芯片,DPU由此产生。

DPU解决的是大流量网络数据包处理占用CPU问题。

有人说,DPU正在取代CPU,建立以数据为中心的计算架构。

a933a4a0-a242-11ed-bfe3-dac502259ad0.png

| DPU架构,来源:StatusNeo

CPU用于通用计算,GPU用于加速计算,而DPU则进行数据处理。

DPU和CPU最大的区别是,CPU擅长一般的计算任务,而DPU更擅长基础层应用任务,比如网络协议处理、交换路由计算、加密解密、数据压缩等等。

简单来说,CPU做不好,GPU做不了的那些任务,交给DPU就完事儿了。

a94be5e2-a242-11ed-bfe3-dac502259ad0.png

DPU并非单一芯片,而是一块SoC(System On Chip,片上系统)芯片,一个DPU一般包含一个CPU、NIC和可编程数据加速引擎。这使得 DPU 具有CPU的通用性和可编程性,同时专门针对网络数据包、存储请求或分析请求进行高效处理。

一个高性能、软件可编程的多核 CPU,通常基于广泛使用的 Arm 架构,与其他 SoC 组件紧密耦合

一种高性能网络接口,能够解析、处理数据,并有效地将数据传输到GPU和CPU。

一组丰富的灵活、可编程的加速引擎,可以卸载和提高人工智能和机器学习、零信任安全、网络和存储等应用程序的性能。

DPU 可以是基于 ASIC 的、基于FPGA 的或基于SoC 的。由于以数据为中心的计算的使用增加,DPU 越来越多地用于数据中心、大数据、安全和人工智能/机器学习/深度学习等场景。

如果说CPU是计算生态的底座、主力芯片的基石,GPU是从图形处理到数据处理芯片的蜕变,那么DPU则是因数据中心而生的芯片。

DPU能够助力数据中心更高效的应对多元化的算力需求。

未来DPU也将与 CPU 、 GPU 形成新的“铁三角”,彻底颠覆数据中心的运算模式。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4729

    浏览量

    128885
  • DPU
    DPU
    +关注

    关注

    0

    文章

    357

    浏览量

    24169
  • 硬盘驱动器
    +关注

    关注

    0

    文章

    34

    浏览量

    10487
  • 中央处理器
    +关注

    关注

    1

    文章

    124

    浏览量

    16515
  • NIC
    NIC
    +关注

    关注

    0

    文章

    23

    浏览量

    12415

原文标题:有了CPU、GPU,为啥还需要DPU?

文章出处:【微信号:SDNLAB,微信公众号:SDNLAB】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    数据处理器:DPU编程入门》读书笔记

    ,让用户可以不用关注DPU的底层硬件接口而直接对硬件进行编程。 此外,DPU数据中心基础架构的处理芯片,预测至少30%的CPU资源用于执行数据
    发表于 12-21 10:47

    数据处理器:DPU编程入门》DPU计算入门书籍测评

    一、DPU计算框架 通过一周多的时间翻阅这本书,基本上这本书是一本比较全面的,面向架构的新手指导数据。它在书中详尽介绍了关于DPU在计算机架构中的应用。 对于DPU来说,是一种平行于
    发表于 12-24 10:54

    数据处理问题!

    数据处理基本包涵拟合,插值,滤波等,LabVIEW中一般处理的都是N行1列数据,怎么处理N行,M列数据,我现在需要将所有组
    发表于 05-08 22:43

    labview数据处理 思路!!!!!!!

    如题,想用labview数据处理,具体如下:记事本中有两列数据(几万行),第一列为时间轴,第二列为每个时间点对应的数据,想用labview将其转化为波形图(类似正弦曲线那种)横轴时间
    发表于 07-31 20:28

    专⽤数据处理器 (DPU) 技术⽩⽪书

    发展历程 161.4. DPU与CPU、GPU的关系 191.5. DPU的产业化机遇 212.DPU特征结构232.1. DPU是以
    发表于 03-14 17:35

    英伟达DPU的过“芯”之处

    GPU技术大会,从黄仁勋那里听到:数据中心已成为全新的计算单元。黄仁勋之所以有这样的底气,就在于这次发布会上推出了一款全新处理DPU,以及
    发表于 03-29 14:42

    【书籍评测活动NO.23】数据处理器:DPU编程入门

    资格! “DPU将是未来计算的三大支柱之一。CPU用于通用计算,GPU用于加速计算,而DPU数据中心移动数据,进行
    发表于 10-24 15:21

    什么是DPU

    和服务器内,CPU和GPU已经被广泛地用于各个新型超大规模数据中心。 这些数据中心通过功能强大的新型处理器连接在一起,DPU( Data P
    发表于 11-03 10:55

    数据处理器:DPU编程入门》+初步熟悉这本书的结构和主要内容

    DPU的应用场景与价值? 主要有以下几个方面: 数据中心:DPU可以用于加速大规模数据中心的数据处理
    发表于 12-08 18:03

    各大巨头纷纷入局DPUDPU真的会成另一个GPU

    Unit ,数据处理器)已经成为了以数据为中心的加速计算模型的第三个计算单元。 CPU用于通用计算,GPU用于加速计算,而数据中心中传输
    的头像 发表于 12-31 15:07 4050次阅读

    全球首款集成NVIDIA BlueField DPU技术的关键任务型存储已经到来

    DPU数据处理单元,全称Data Processing Unit,是以数据处理为核心任务处理
    的头像 发表于 11-15 09:54 843次阅读

    DPU处理器在数据中心的作用是什么?

    CPU和GPU广泛应用于数据中心,它们非常昂贵,需要消耗大量电力,有时却被要求处理一些并不擅长的工作。   工欲善其事必先利其器,如果把CPU、GPU
    发表于 04-19 11:26 483次阅读

    DPU数据处理器)能做什么?

    了解DPU数据处理器的基础知识:它们是什么、它们做什么、谁在制造它们以及谁在采用它们。然后决定您的数据中心是否有朝一日会使用。 数据处理器是针对
    的头像 发表于 04-19 15:38 2787次阅读

    DPU处理器在数据中心的作用是什么

    CPU和GPU广泛应用于数据中心,它们非常昂贵,需要消耗大量电力,有时却被要求处理一些并不擅长的工作。 工欲善其事必先利其器,如果把CPU、GPU
    的头像 发表于 04-19 15:44 1394次阅读
    <b class='flag-5'>DPU</b><b class='flag-5'>处理</b>器在<b class='flag-5'>数据</b>中心的作用是什么

    为什么现有网络设施需要集成SmartNIC / DPU

    长期以来,CPU一直被视为计算处理设备的支柱,GPU则用于处理实时图形。然而,近来备受瞩目的是数据处理单元——
    发表于 07-27 16:16 507次阅读
    为什么现有网络设施需要集成SmartNIC / <b class='flag-5'>DPU</b>?