0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DPU特征结构系列(一)DPU是以数据为中心IO密集的专用处理器

中科驭数(北京)科技有限公司 2022-04-27 14:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从应用特征来看,可以把应用分为“IO密集型”和“计算密集型”两类,如下图所示。IO密集型应用,通常体现为较高的输入和输出带宽,数据直接来自于IO,数据通常具备流式特征,数据局部性不显著,如果处理性能与带宽匹配,片上缓存的作用就可以弱化。例如处理路由转发、数据加密、压缩等。计算密集型应用,体现为较高的计算密度,通常浮点性能突出,数据来自主存,数据局部性显著,复用性高,主存的大小对于问题求解的性能有直接影响。例如求解线性代数方程组,大规模神经网络训练、推理等。

pYYBAGJo3EOAddbKAAhA9nkSZ-c278.png

图不同类型的处理器的特征结构

一个处理器芯片是“IO密集”还是“计算密集”只部分决定了芯片的结构特征,并不能完全定义芯片的主体架构。无论是IO密集,还是计算密集,即可以以通用CPU为核心构造主体计算架构,也可以以专用加速器为核心构造主体计算架构。前者可称之为以控制为中心(control-centric)的模式,后者称之为以数据为中心(data-centric)的模式。控制为中心的核心是实现“通用”,数据为中心的核心是通过定制化实现“高性能”。以应用特征和架构特征这两个维度粗略划分处理器芯片类型分布,如图2-1所示。

通用CPU是偏向于控制为中心结构,理论上看就是要“图灵完备”,要支持完备的指令集,通过编程指令序列来定义计算任务,通过执行指令序列来完成计算任务,因此具备极其灵活的编程支持,可以任意定义计算的逻辑实现“通用”——这也是CPU最大的优势。同时,为了提高编程的开发效率,降低编译器复杂度,缓存管理和细粒度并行度的开发通常都是由硬件来完成。类似的,还有大量的用于各种嵌入式、移动设备的微控制器MCU,并不强调高带宽,也是以控制为中心的结构。NP,DSP也是便向于基于通用处理器来做专用化扩展,但是非常注重高通量的性能属性。例如,NP要支持数Tbps的转发带宽,所以大体可以视为控制为中心、但是IO密集的处理器类型。

GPU是以数据为中心的结构,形式上更倾向于专用加速器。GPU的结构称之为数据并行(data-parallel)结构,优化指令并行度并不是提升性能的重点,通过大规模同构核进行细粒度并行来消化大的数据带宽才是重点。例如,最新的NVIDIA TITAN RTX GPU有4608个CUDA核、576个Tensor核,而且单片GPU通常配置数十GB的超大显存。同时缓存管理多采用软件显示管理,降低硬件复杂度。这类超众核结构是以数据为中心、执行计算密集型任务的代表性架构。

DPU也偏向于数据为中心的结构,形式上集成了更多类别的专用加速器,牺牲一定的指令灵活性以获得更极致的性能。但是与GPU不同,DPU要应对更多的网络IO,既包括外部以太网,也包括内部虚拟IO,所以DPU所面临的数据并行更多可能是数据包并行,而不是图像中的像素、像块级并行。而且DPU也会配置少数通用核(如ARM,MIPS)来处理一定的控制面的任务,运行轻量级操作系统来管理DPU上的众多的异构核资源,所以体现了一定“通用”性,但性能优势主要不源于这些通用核,而是大量专用计算核。早期的一些网络处理器采用过类似Tile64的通用众核结构,以增加核的数量来应对多路处理的数据,实现并发处理,但单路延迟性能通常都比较差。因此,DPU更偏向于以数据为中心,执行IO密集任务。

DPU是软件定义的技术路线下的重要产物。在软件定义网络中,将数据面与控制面分离是最核心的思想。DPU被定义为强化了数据面性能的专用处理器,配合控制面的CPU,可以实现性能与通用性的更佳的平衡。

来源:专用数据处理器(DPU)技术白皮书,中国科学院计算技术研究所,鄢贵海等

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DPU
    DPU
    +关注

    关注

    0

    文章

    419

    浏览量

    27173
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    隼瞻科技完成近亿元天使+轮融资,加速领域专用处理器敏捷设计的落地应用

    科技在 DSA(Domain Specific Architecture 面向特定场景优化的先进架构)处理器赛道的技术深耕与市场拓展注入强劲动能,进步巩固其在专用处理器IP与EDA工具领域的领先地位。 技术立本 国内唯
    的头像 发表于 05-20 14:27 329次阅读

    BK7259 具备边缘AI能力的高级音视频Wi-Fi +蓝牙SOC芯片/规格书/原理图

    协议。该方案专为需要丰富资源和低功耗的应用而设计。 无线处理器+应用处理器(内置Arm@EthosTM- U65) 二.BK7259配备个无线处理器
    发表于 04-28 09:53

    深入剖析STA2065:高性能信息娱乐应用处理器

    深入剖析STA2065:高性能信息娱乐应用处理器 在电子设备飞速发展的今天,款优秀的应用处理器对于实现各种复杂功能起着至关重要的作用。今天,我们就来深入了解下意法半导体(ST)推出
    的头像 发表于 04-16 14:05 175次阅读

    STA2064:高度集成的信息娱乐应用处理器

    与高性能嵌入式GPS,车辆主机、移动导航、远程信息处理、信息娱乐、高级音频和连接系统等应用提供了强大的支持。下面我们就来详细了解下这款处理器。 文件下载: STA2064N.pdf
    的头像 发表于 04-16 14:05 238次阅读

    恩智浦全新i.MX 93W应用处理器重磅发布

    恩智浦半导体宣布推出i.MX 93W应用处理器,进步扩展其i.MX 93产品系列。这款i.MX 93W片上系统(SoC)专为加速物理AI的部署而设计,是首款将专用AI神经
    的头像 发表于 03-16 09:45 2605次阅读

    支持蓝牙Piconet和Scatternet组网协议的高性能32位蓝牙音频应用处理器-BP1048B2

    32位蓝牙音频应用处理器种集成了‌32位RISC内核、DSP指令集、浮点运算单元(FPU)以及蓝牙通信功能‌的专用芯片,专为处理高质量音频流而设计。
    的头像 发表于 03-11 16:43 406次阅读
    支持蓝牙Piconet和Scatternet组网协议的高性能32位蓝牙音频应<b class='flag-5'>用处理器</b>-BP1048B2

    DPU数据处理器的核心功能和应用领域

    DPU,全称数据处理器(Data Processing Unit),是种专门用于处理数据中心数据
    的头像 发表于 02-02 13:52 1142次阅读
    <b class='flag-5'>DPU</b><b class='flag-5'>数据处理器</b>的核心功能和应用领域

    基于DPU的智能盘框方案,华为如何大幅提升AI推理的效率?

    DPU
    脑极体
    发布于 :2026年01月20日 12:53:10

    探索NXP i.MX 93应用处理器家族:高效边缘计算的理想之选

    和丰富的功能,边缘计算应用提供了强大的支持。本文将深入介绍i.MX 93应用处理器家族的特点和优势,电子工程师们在设计相关产品时提供有价值的参考。 文件下载: NXP Semiconductors i.MX 93节能应
    的头像 发表于 12-24 14:50 946次阅读

    探索i.MX 91应用处理器家族:边缘应用带来新可能

    开发者提供了个强大而灵活的平台。今天,我们就来深入了解下i.MX 91应用处理器家族的特点和优势。 文件下载: NXP Semiconductors i.MX 91应用处理器.pd
    的头像 发表于 12-24 11:50 1499次阅读

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服务 AI 数据存储、网络和安全带来突破性的加速。
    的头像 发表于 11-03 14:48 1282次阅读

    恩智浦推出i.MX 952人工智能应用处理器

    恩智浦半导体宣布推出i.MX 9系列的新成员——i.MX 952应用处理器。该处理器专为AI视觉、人机接口(HMI)及座舱感知应用而设计,通过集成eIQ Neutron神经处理单元(N
    的头像 发表于 10-27 09:15 3819次阅读

    RISC-V DPU,重塑数据中心算力格局?

    电子发烧友网综合报道 在现代数据中心架构中,数据处理单元(DPU)正迅速崛起继 CPU 和 GPU 之后的第三颗核心芯片。DPU 专为
    的头像 发表于 09-13 00:51 5162次阅读

    第三届NVIDIA DPU黑客松开启报名

    第三届 NVIDIA DPU 中国虚拟黑客松(Hackathon)将于 6 月 28 日 - 6 月 30 日正式开启!作为备受广大开发者期待的年度赛事,它将提供与 NVIDIA 加速网络技术深度
    的头像 发表于 05-27 10:16 1084次阅读

    中科驭数携DPU全栈产品亮相福州数博会,赋能智算时代算力基建

    会”)也拉开帷幕。共有150多家企业参展,展会吸引了八万多名观众参观。作为国内DPU领域领军企业,中科驭数携三大产品线亮相展会,其创新的DPU技术方案成为专业观众关注焦点。据大会报告的数据显示,我国算力总规模已达280EFLOP
    的头像 发表于 05-23 11:01 804次阅读
    中科驭数携<b class='flag-5'>DPU</b>全栈产品亮相福州数博会,赋能智算时代算力基建