0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

各大巨头纷纷入局DPU:DPU真的会成另一个GPU吗

ss 来源:电子产品世界 作者:陈玲丽 2020-12-31 15:07 次阅读

过去十年中,计算已经不仅仅局限在个人电脑和服务器内,CPUGPU已经被广泛地用于各个新型超大规模数据中心。这些数据中心通过功能强大的新型处理器连接在一起,DPU( Data Processing Unit ,数据处理器)已经成为了以数据为中心的加速计算模型的第三个计算单元。

CPU用于通用计算,GPU用于加速计算,而数据中心中传输数据的DPU则进行数据处理。

欢迎来到启用DPU的数据革命时代

根据现今最著名的历史学家之一Yuval Noah Harari的说法 ,人类面临着四次重大革命:

· 公元前70,000年发生的认知革命定义了语言的诞生和交流的能力。它也克服了尼安德特人,将智人带到了舞台的前列。

· 农业革命发生在公元前10000年,它定义了人类驯养家畜和种植农作物的能力,加速了人类人口的增长,推动了城市的崛起。

· 科学革命是一系列事件,标志着现代科学在早期现代时期的出现,当时数学、物理、天文学和科学的发展为我们现代生活方式奠定了基础。

· 我们今天目睹的第四次革命是数据革命。

与之前的重大技术变革(例如个人计算机、客户端服务器甚至虚拟化)不同,数据革命比以前的革命更隐蔽。这种转变的核心是需要发动下一次重大技术飞跃,其中机器学习是实现真正人工智能的起点。为了达到这个目标,我们需要处理大量的数据。

随着我们进入数据革命时代,对更高计算性能的不断增长的需求正在推动新的数据中心加速器和处理单元的诞生。以前CPU和GPU是计算能力的主要来源。数据量和复杂性的指数级增长推动了以数据为中心的体系结构和新型加速器单元的创建。

在以数据为中心的设计中,完整的基础架构堆栈(包括计算,存储和网络)的架构旨在快速有效地捕获、分析、分类、管理和存档大量数据,新一代加速器应运而生 —— DPU。

CPU,GPU和DPU的组合是协同处理的下一个飞跃,它将利用这些革命性的硬件加速技术和软件定义的可编程性来应对以数据为中心和边缘计算架构的挑战,最大程度地提高投资回报率,并使不可能成为可能。

DPU有什么与众不同之处?

为什么人们如此渴望使用DPU?首先,它更安全,因为控制平面可以在系统内和系统集群之间与数据平面分离。目前服务器要处理的资料日益增多,除了原有的加解密、封包压缩外,加速器也让服务器要处理的资料量变得更庞大,就会造成原有CPU在处理安全能力表现上出现瓶颈。

DPU可以执行原本需要CPU处理的网络、存储和安全等任务。这就意味着如果在数据中心中采用了DPU,那么CPU的不少运算能力可以被释放出来,去执行广泛的企业应用。

DPU的主要作用就在于替代了数据中心原本用来处理分布式存储和网络通信的CPU处理器资源。在DPU之前,智能网卡(SmartNIC)正在网络安全和网络互连协议方面逐渐取代CPU。而现在DPU的出现,相当于是智能网卡的升级替代版本,一方面增强了智能网卡对网络安全和网络协议的处理能力,一方面又整合和加强了分布式存储的处理能力,从而在这两个领域更好地替代CPU,从而释放CPU的算力给到其他更多应用。

有了DPU的出现,就可以先在DPU将大量的信息先做消化,接着再传递给CPU做其他的分配,如此一来能减少CPU约30%的消耗。

DPU是一种新型可编程处理器,是一种SOC(System On Chip),它结合了:

· 行业标准的、高性能及软件可编程的多核CPU,通常基于已应用广泛的Arm架构,与其的SOC组件密切配合。

· 高性能网络接口,能以线速或网络中的可用速度解析、处理数据,并高效地将数据传输到GPU和CPU。

· 各种灵活和可编程的加速引擎,可以卸载AI、机器学习、安全、电信和存储等应用,并提升性能。

DPU引入机器学习算法可对数据进行智能管理、控制和分析,从而减少闪存擦写次数,延长SSD使用寿命;还可减少盘内计算和总线数据量,减轻主机CPU的负担。所有这些DPU功能对于实现安全的、裸性能的、原生云计算的下一代云上大规模计算至关重要。

CPU、GPU、DPU将代表未来计算的三大支柱。这三者之间,CPU用于通用计算,GPU用于加速计算,而DPU在数据中心周围移动数据进行数据处理。DPU可以和CPU、GPU相结合,构成完全可编程的单一AI计算单元,实现前所未有的安全性和算力支持。

国际巨头开始纷纷提前布局

自1950年代以来,中央处理器“ CPU”一直是每台计算机或智能设备的核心;到1990年代以来,GPU或图形处理单元扮演了重要角色。在过去的十年中,计算已经摆脱了PC和服务器的繁琐局限,CPU和GPU为庞大的新超大规模数据中心提供了动力。然而最近几年,随着系统中的CPU承受越来越多的网络和存储工作负载,DPU已成为以数据为中心的加速计算模型的第三个成员。

根据THENEXTPLATFORM的分析指出,在2020年,在这个领域的玩家或者潜在玩家主要包括Broadcom、Intel英伟达、Netronome、Pensando、Fungible和Xilinx,还包括云供应商三大巨头。

DPU是英伟达最新的一个布局。英伟达对DPU尤为重视,最主要的布局就在于2019年3月,花费69亿美元收购了以色列芯片公司Mellanox —— Mellanox在2015年9月以8.11亿美元的天价收购了EZchip公司,该公司拥有多核芯片创业公司Tilera的资产,Tilera是最早使用知识产权的高度并行SmartNIC实施之一,该实施源自更早的MIT研究项目。

Mellanox所擅长的正是为服务器、存储和超融合基础设施提供包括以太网交换机、芯片和InfiniBand智能互连解决方案在内的大量的数据中心产品。英伟达的GPU与Mellanox的互连技术结合,可以使得数据中心工作负载将在整个计算、网络和存储堆栈中得以优化,并能实现更高的性能、更高的利用率和更低的运营成本。

黄仁勋把Mellanox的技术看作是公司的“X因素”,也就是把数据中心改造成一个可以解决高性能计算要求的大型处理器架构。而如今我们看到DPU的出现,已经是具有这一架构雏形的一种尝试了。

英伟达在DPU上的技术突破,是在收购Mellanox之后,在这家公司的硬件基础上开发出BlueFeild系列的两款DPU —— 英伟达BlueField-2 DPU与BlueField-2X DPU。

英伟达发力DPU建设的深层目的:一个是DPU试图再一次复制GPU替代显示加速卡成为通用显示芯片的路径;再一个是DOCA试图再一次复制CUDA在GPU通用化过程中所起到的开创生态之功。

与此同时,随着数据中心网络中传送的数据量以每年25%的速度增长,英特尔也对DPU很感兴趣。因为预算不能以这种速度增长,而且由于对原始CPU计算的偏见投资(与构建平衡的系统以更充分地利用可用的计算能力相反),网络通常不超过分布式成本的10%系统。面对所有这些压力,英特尔必须创新并帮助改善网络,英特尔认为集成显得很重要。

在DPU上,英特尔主要是将CPU和FPGA结合在一起,但英特尔并自己做,而是由Inventec和Silicom制造的。前者对于hyperscalers和云构建者来说是日益重要的ODM,而后者则是过去二十年来的网络接口供应商。

另外,英特尔收购了深度学习芯片公司Nervana Systems,以及移动和嵌入式机器学习公司Movidius,给未来的深度学习下了重注。而英特尔所做的这一切,正是在为未来适应深度学习的数据流(DPU)架构升级布局。

越来越多供应商纷纷涌入DPU架构。DPU能否演绎CPU和GPU的佳话?十年前,随着硬件加速技术的第一次重大冲击,我们对GPU产品充满了兴趣。现在,随着FPGA扩展到超过300万个逻辑单元,FPGA得以与其他可组合的处理模块紧密地结合在一起,以实现网络、内存、存储和计算。有了这些进步,我们开始认识到第二次硬件加速浪潮的形成。让我们静待其变。

英伟达挑战英特尔,距离还有多远

另外一个值得注意的是英伟达提出配合DPU处理器的软件开发工具包 —— DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)。英伟达的专家将DOCA类比为数据中心服务器领域的CUDA,其意图在于帮助开发人员在DPU加速的数据中心基础设施上构建相应的应用程序,从而丰富DPU的应用开发生态。

如果和不久前英伟达收购ARM的消息结合起来,我们看到英伟达的一个重要考量,就是以ARM架构的CPU为核心,从服务器的应用加速扩展到服务器的全部应用场景,从而实现在数据中心服务器领域的更大突破,目标自然是英特尔CPU为代表的X86服务器生态。

自从英伟达开始收购ARM,外界能够看到英伟达已经多次显示出其试图利用ARM处理器进一步占领数据中心服务器市场的决心,而集成了ARM核心的DPU将成为其打入数据中心存量市场取代X86 CPU的第一个切入点。

英伟达推出DPU来切入这个市场,而非直接用ARM核心CPU来与X86 CPU直接竞争,其实是一种比较讨巧的做法,相当于用集成了网络、存储、安全等任务的下一代CPU产品来达到逐渐替换CPU的目的,即使其中所内涵的ARM CPU性能无法对标同一代的X86 CPU,但是整体机由于在DPU SoC上集成了专用的处理加速模块,因此总体性能一定是超过X86 CPU的。

但是英伟达想要在中高端处理器市场来挑战英特尔,还要面临一系列的困难。首先,正是英伟达的GPU与X86 CPU已经形成一种非常稳定的强互补关系。英伟达想要采用基于ARM架构的处理器做高端服务器,还需要ARM处理器性能出现大幅的提升,而现在这一进程并不明朗。

英伟达在数据中心领域的成功与否,都与能否实现数据中心的规模化运算有关,从发展自研的DGX系列服务器到整合Mellanox的技术,再到借助ARM生态发展全新的数据中心计算架构,都是为转型数据中心业务所作的准备。当然,想要实现这一目标,还要看下英特尔如何应对。

英特尔早已为应对英伟达的种种挑战进行了相应的回应和布局。早在2017年,英特尔就宣布要开发全栈的GPU产品组合,而预计明年英特尔的首批GPU将在使用GPU的各个市场上发布。

目前来说,数据中心当中,95%左右的GPU仍然还是连接到x86的CPU之上,英伟达如果单纯只是做GPU的增量,仍然无法撼动英特尔在数据中心服务器的霸主地位。

数据中心业务对于英特尔来说,也正在成为其最核心的业务组成。2019年Q4英特尔的数据中心业务超越PC业务,成为其收入的主要来源;而在今年,英特尔对其技术组织和执行团队的重组,也被外界视为全面转型数据中心业务的开始。

可以想见在未来的数据中心处理器业务上,英伟达将迎来英特尔最为强劲的保卫战和反击战,而广大的服务器集成商或将成为这场角力赛的受益方。

英伟达还要面对ADM这一新对手的追赶,不久前ADM曝出要花费300亿美金收购赛灵思,就被看作是叫板英特尔,阻击英伟达的双战略。

除此之外,英伟达还要在数据中心处理器业务中面临来自客户自研芯片的挑战。云服务商本身也不愿意完全将自身的计算核心完全交给英伟达,无论是AWS、还是谷歌、阿里巴巴、华为,都已经在布局自己的云端处理器。

数据中心已经成为英特尔、英伟达、AMD这些老牌芯片巨头未来争夺的主战场,DPU是数据中心战场中重要一役。

作为一个“芯”生事物,走稳是当下的要务。DPU还在早期阶段,这走的或是类似GPU的革命路线。GPU刚出来时业界均不看好,但英伟达却矢志不渝,不断迭代和优化,最终GPU一路狂奔,到最后全面接管了图形图像的显示控制,并在AI时代成为主力核心。但DPU真的会成另一个GPU吗?

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10922

    浏览量

    213302
  • 数据
    +关注

    关注

    8

    文章

    7195

    浏览量

    89837
  • DPU
    DPU
    +关注

    关注

    0

    文章

    369

    浏览量

    24292
收藏 人收藏

    评论

    相关推荐

    利用NVIDIA DPF引领DPU加速云计算的未来

    DPU 的强大功能,并优化 GPU 加速计算平台。作为种编排框架和实施蓝图,DPF 使开发者、服务提供商和企业能够无缝构建 BlueField 加速的云原生软件平台。
    的头像 发表于 01-24 09:29 248次阅读
    利用NVIDIA DPF引领<b class='flag-5'>DPU</b>加速云计算的未来

    中科驭数凭借在DPU芯片领域的积累被认定为北京市知识产权优势单位

    近日北京市知识产权公布了2024年拟认定北京市知识产权优势单位名单,中科驭数凭借在DPU芯片领域积累的知识产权成果以及在知识产权创造、运用、保护和管理等方面的优势,被认定为北京市知识产权优势单位
    的头像 发表于 12-31 18:49 420次阅读
    中科驭数凭借在<b class='flag-5'>DPU</b>芯片领域的积累被认定为北京市知识产权优势单位

    中科驭数分析DPU在云原生网络与智算网络中的实际应用

    的探索与实践”专题论坛,业内DPU专家们将讨论焦点锁定在了DPU在云原生网络与智算网络中的实际应用,深入探讨了如何利用DPU技术解决计算系统级问题,进步推动了
    的头像 发表于 08-02 11:21 802次阅读

    IaaS+on+DPU(IoD)+下代高性能算力底座技术白皮书

    DPU 是当下算力基础设施的核心创新之。如果把 CPU 比做大脑,那么 GPU 就好比是肌肉,而 DPU 就是神经中枢。CPU 承载了应用生态,提供了通用型算力;
    发表于 07-24 15:32

    中科驭数:DPU是构建高效智算中心基础设施的必选项

    先生在《基于DPU的高效智算中心算力底座》主题分享中提出,大模型等智算业务推动算力需求规模快速增长,CPU+GPU+DPU的新型计算节点架构已成为高效智算中心的标准配置,为构建高性能、高灵活性、高安全性的算力基础设施提供了强大支撑。
    的头像 发表于 07-08 10:51 763次阅读

    中科驭数发布第三代DPU芯片K2 Pro,较上代能耗降低30%

    基于该芯片的自研芯片架构和专用的指令集技术。   该公司表示,之所以发布整套技术而非单颗芯片,是因为它们相互依赖、相互增强,共同构成了高效、灵活且功能强大的DPU解决方案。  
    的头像 发表于 07-01 07:32 3724次阅读

    中科驭数CEO鄢贵海:从计算系统的三视角重新审视DPU的核心价值

    如何找准价值定位?而中科驭数作为国内DPU先行者,又将如何解题,引领DPU行业进入到全新的高度? 6月19日,在中科驭数2024产品发布会上,中科驭数CEO鄢贵海发表了《重新定义
    的头像 发表于 06-28 14:27 565次阅读
    中科驭数CEO鄢贵海:从计算系统的三<b class='flag-5'>个</b>视角重新审视<b class='flag-5'>DPU</b>的核心价值

    芯片软件全上阵 DPU“全家桶”来了!中科驭数成功举办2024产品发布会

    6月19日,中科驭数2024产品发布会在北京中关村展示中心正式举办。聚焦自研DPU核心技术,中科驭数重磅发布最新DPU芯片K2 Pro、软件开发平台HADOS、以及系列针对数据中
    的头像 发表于 06-23 11:09 975次阅读
    芯片软件全上阵 <b class='flag-5'>DPU</b>“全家桶”来了!中科驭数成功举办2024产品发布会

    中科驭数发布高性能DPU芯片K2-Pro

    在信息技术领域,每次芯片技术的突破都代表着行业的次飞跃。近日,DPU领域的领军企业中科驭数宣布,成功研发并发布了其第三代DPU芯片——“K2-Pro”。这款芯片的发布,标志着中科驭
    的头像 发表于 06-21 11:41 903次阅读

    NVIDIA DPU编程入门开课仪式在澳门科技大学成功举办

    5 月 24 日,NVIDIA DPU 编程入门开课仪式在澳门科技大学成功举办。作为首个在中国开设 NVIDIA DPU 编程相关课程的高校,来自澳门科技大学不同院系的师生共同见证了本次仪式。
    的头像 发表于 05-28 09:40 451次阅读

    DPU技术赋能下代AI算力基础设施

    4月19日,在以“重构世界 奔赴未来”为主题的2024中国生成式AI大会上,中科驭数作为DPU新型算力基础设施代表,受邀出席了中国智算中心创新论坛,发表了题为《以网络为中心的AI算力底座构建之路》主题演讲,勾勒出在通往AGI之路上,DPU技术赋能下
    的头像 发表于 04-20 11:31 965次阅读

    明天线上见!DPU构建高性能云算力底座——DPU技术开放日最新议程公布!

    技术在不同行业中的应用解决方案有哪些?能带来怎样的业务效果? 3月29日本周五,中科驭数集结产品大咖及解决方案专家团,诚邀您参加以“DPU构建高性能云算力底座”为主题的线上DPU技术开放日! 他们将逐与您分享中科驭数系列
    的头像 发表于 04-03 18:12 1047次阅读

    中科驭数DPU技术开放日秀“肌肉”:云原生网络、RDMA、安全加速、低延时网络等方案组团亮相

    DPU技术开放日既是对DPU技术应用的典型方案展示,也是DPU技术在重要细分场景走向成熟的标志。
    的头像 发表于 04-01 11:48 876次阅读
    中科驭数<b class='flag-5'>DPU</b>技术开放日秀“肌肉”:云原生网络、RDMA、安全加速、低延时网络等方案组团亮相

    FPGA-Based DPU网卡的发展和应用

    采用单芯片的SoC形态,兼顾性能和功耗。FPGA-Based DPU在硬件设计上的挑战主要来自芯片面积和功耗。
    发表于 02-23 14:40 2261次阅读
    FPGA-Based <b class='flag-5'>DPU</b>网卡的发展和应用