0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DPU特征结构系列(一)DPU是以数据为中心IO密集的专用处理器

中科驭数(北京)科技有限公司 2022-04-27 14:41 次阅读

从应用特征来看,可以把应用分为“IO密集型”和“计算密集型”两类,如下图所示。IO密集型应用,通常体现为较高的输入和输出带宽,数据直接来自于IO,数据通常具备流式特征,数据局部性不显著,如果处理性能与带宽匹配,片上缓存的作用就可以弱化。例如处理路由转发、数据加密、压缩等。计算密集型应用,体现为较高的计算密度,通常浮点性能突出,数据来自主存,数据局部性显著,复用性高,主存的大小对于问题求解的性能有直接影响。例如求解线性代数方程组,大规模神经网络训练、推理等。

pYYBAGJo3EOAddbKAAhA9nkSZ-c278.png

图不同类型的处理器的特征结构

一个处理器芯片是“IO密集”还是“计算密集”只部分决定了芯片的结构特征,并不能完全定义芯片的主体架构。无论是IO密集,还是计算密集,即可以以通用CPU为核心构造主体计算架构,也可以以专用加速器为核心构造主体计算架构。前者可称之为以控制为中心(control-centric)的模式,后者称之为以数据为中心(data-centric)的模式。控制为中心的核心是实现“通用”,数据为中心的核心是通过定制化实现“高性能”。以应用特征和架构特征这两个维度粗略划分处理器芯片类型分布,如图2-1所示。

通用CPU是偏向于控制为中心结构,理论上看就是要“图灵完备”,要支持完备的指令集,通过编程指令序列来定义计算任务,通过执行指令序列来完成计算任务,因此具备极其灵活的编程支持,可以任意定义计算的逻辑实现“通用”——这也是CPU最大的优势。同时,为了提高编程的开发效率,降低编译器复杂度,缓存管理和细粒度并行度的开发通常都是由硬件来完成。类似的,还有大量的用于各种嵌入式、移动设备的微控制器MCU,并不强调高带宽,也是以控制为中心的结构。NP,DSP也是便向于基于通用处理器来做专用化扩展,但是非常注重高通量的性能属性。例如,NP要支持数Tbps的转发带宽,所以大体可以视为控制为中心、但是IO密集的处理器类型。

GPU是以数据为中心的结构,形式上更倾向于专用加速器。GPU的结构称之为数据并行(data-parallel)结构,优化指令并行度并不是提升性能的重点,通过大规模同构核进行细粒度并行来消化大的数据带宽才是重点。例如,最新的NVIDIA TITAN RTX GPU有4608个CUDA核、576个Tensor核,而且单片GPU通常配置数十GB的超大显存。同时缓存管理多采用软件显示管理,降低硬件复杂度。这类超众核结构是以数据为中心、执行计算密集型任务的代表性架构。

DPU也偏向于数据为中心的结构,形式上集成了更多类别的专用加速器,牺牲一定的指令灵活性以获得更极致的性能。但是与GPU不同,DPU要应对更多的网络IO,既包括外部以太网,也包括内部虚拟IO,所以DPU所面临的数据并行更多可能是数据包并行,而不是图像中的像素、像块级并行。而且DPU也会配置少数通用核(如ARM,MIPS)来处理一定的控制面的任务,运行轻量级操作系统来管理DPU上的众多的异构核资源,所以体现了一定“通用”性,但性能优势主要不源于这些通用核,而是大量专用计算核。早期的一些网络处理器采用过类似Tile64的通用众核结构,以增加核的数量来应对多路处理的数据,实现并发处理,但单路延迟性能通常都比较差。因此,DPU更偏向于以数据为中心,执行IO密集任务。

DPU是软件定义的技术路线下的重要产物。在软件定义网络中,将数据面与控制面分离是最核心的思想。DPU被定义为强化了数据面性能的专用处理器,配合控制面的CPU,可以实现性能与通用性的更佳的平衡。

来源:专用数据处理器(DPU)技术白皮书,中国科学院计算技术研究所,鄢贵海等

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DPU
    DPU
    +关注

    关注

    0

    文章

    353

    浏览量

    24091
收藏 人收藏

    评论

    相关推荐

    安谋科技发布“玲珑”DPU和新代VPU

    安谋科技(中国)有限公司在自研技术道路上再迈坚实步伐,近日震撼发布首款“玲珑”系列DPU数据处理单元)及新代VPU(视频处理单元)。此次
    的头像 发表于 09-24 14:33 219次阅读

    OMAP5912应用处理器数据

    电子发烧友网站提供《OMAP5912应用处理器数据表.pdf》资料免费下载
    发表于 08-07 09:16 0次下载
    OMAP5912应<b class='flag-5'>用处理器</b><b class='flag-5'>数据</b>表

    IaaS+on+DPU(IoD)+下代高性能算力底座技术白皮书

    数据中心的第三颗“主力芯片”,主要通过其专用处理器优化数据中心的网络、存储、安全等处理性能,助力服务运行效率显著提升,有效降低成本。因此,
    发表于 07-24 15:32

    中科驭数:DPU是构建高效智算中心基础设施的必选项

    先生在《基于DPU的高效智算中心算力底座》主题分享中提出,大模型等智算业务推动算力需求规模快速增长,CPU+GPU+DPU的新型计算节点架构已成为高效智算中心的标准配置,
    的头像 发表于 07-08 10:51 629次阅读

    中科驭数发布第三代DPU芯片K2 Pro,较上代能耗降低30%

    电子发烧友网报道(文/李弯弯)近日,中科驭数(北京)科技有限公司(以下简称“中科驭数”)在北京发布了关于DPU(指数据处理器芯片)的套核心技术,包括国内首颗量产全功能DPU芯片K2P
    的头像 发表于 07-01 07:32 3410次阅读

    芯片软件全上阵 DPU“全家桶”来了!中科驭数成功举办2024产品发布会

    6月19日,中科驭数2024产品发布会在北京中关村展示中心正式举办。聚焦自研DPU核心技术,中科驭数重磅发布最新DPU芯片K2 Pro、软件开发平台HADOS、以及
    的头像 发表于 06-23 11:09 740次阅读
    芯片软件全上阵 <b class='flag-5'>DPU</b>“全家桶”来了!中科驭数成功举办2024产品发布会

    芯启源DPU赋能绿色数据中心,助力实现双碳战略

    近日,深圳市计算机行业协会在南山区前海自贸区的博大数据深圳前海智算中心成功举办了“新质生产力产品与AIPC应用与挑战技术交流会”。芯启源助理副总裁顾宏波受邀分享《DPU赋能绿色数据中心
    的头像 发表于 06-13 09:53 526次阅读

    DPU技术赋能下代AI算力基础设施

    4月19日,在以“重构世界 奔赴未来”为主题的2024中国生成式AI大会上,中科驭数作为DPU新型算力基础设施代表,受邀出席了中国智算中心创新论坛,发表了题为《以网络中心的AI算力底
    的头像 发表于 04-20 11:31 775次阅读

    明天线上见!DPU构建高性能云算力底座——DPU技术开放日最新议程公布!

    算力,是数字经济时代的新质生产力。随着人工智能、智算中心建设等需求不断拓展,DPU在各行各业数据中心的应用逐步深入。异构算力代表DPU在新质生产力建设中,能否给出别开生面的答案,应战算
    的头像 发表于 04-03 18:12 955次阅读

    芯来科技正式发布首款专用处理器产品线Nuclei Intelligence系列

    本土RISC-V CPU IP领军企业——芯来科技正式发布首款针对人工智能应用的专用处理器产品线Nuclei Intelligence(NI)系列,以及NI系列的第款AI
    的头像 发表于 02-26 10:15 1125次阅读
    芯来科技正式发布首款<b class='flag-5'>专用处理器</b>产品线Nuclei Intelligence<b class='flag-5'>系列</b>

    数据处理器DPU编程入门》DPU计算入门书籍测评

    ,国内国外两股部队都在朝着超大规模计算部署。而专用处理器在大规模处理上带来的经济和效率优势是通用计算不可比拟的。DPU在云计算中高性能,高功耗的特点将会完美符合机房设备的特征。也称为需
    发表于 12-24 10:54

    数据处理器DPU编程入门》读书笔记

    目前业界所公认的以数据中心的体系结构下的创新。综上,DPU数据中心来说,是通过更明细的分工来
    发表于 12-21 10:47

    Marvell推出两款新型OCTEON 10 DPU网络设备带来服务级别的性能

    Marvell面向网络设备OEM和企业正式发布的两款新型OCTEN 10 DPU在将功耗降低50%的同时,其性能是现有Marvell解决方案的三倍。 两款新型Marvell OCTEON 10处理器网络设备带来服务
    的头像 发表于 12-12 09:10 731次阅读
    Marvell推出两款新型OCTEON 10 <b class='flag-5'>DPU</b><b class='flag-5'>为</b>网络设备带来服务<b class='flag-5'>器</b>级别的性能

    数据处理器DPU编程入门》+初步熟悉这本书的结构和主要内容

    。随着人们对云计算和大数据处理需求的增加,数据中心的计算负载也不断增加。传统的中央处理器(CPU)在处理这些工作负载时可能会遇到瓶颈,难
    发表于 12-08 18:03

    国际大学生日:探索 DPU 编程,创造 AI 的未来(互动有礼)

    今天是国际大学生日,NVIDIA 怀揣 AI 梦想的学子们打开了扇通往开发世界的大门。 不久前 NVIDIA 推出了备受业界好评的首部 DPU 处理器编程入门书籍 ——《
    的头像 发表于 11-17 21:30 606次阅读
    国际大学生日:探索 <b class='flag-5'>DPU</b> 编程,创造 AI 的未来(互动有礼)