0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Intel Sapphire Rapids CPU,吹响反攻DPU的号角

sakobpqhz 来源:算力基建 作者:算力基建 2022-12-19 15:01 次阅读

152c5e5e-7f48-11ed-8abf-dac502259ad0.png

CPUGPU和DPU是数据中心的三大芯片,通常情况下:CPU主要用于业务应用的处理,GPU用于性能敏感业务的弹性加速,而DPU则是基础设施加速。站在CPU的视角:一开始所有事情都是我的,然后GPU从我这“抢”过去了一部分工作,现在又出现个DPU来跟我“抢食”。是可忍孰不可忍,必须坚决反击!

01CPU视角看硬件加速

站在CPU视角,最开始,一切处理都通过处理器CPU的常规指令集完成。随着CPU性能瓶颈,需要硬件加速的方式来提升性能。硬件加速大致有如下几种方式:

方式1:实现支持扩展指令集的协处理器,实现一定程度的加速能力。比如Intel集成的AVX和AMX指令集,ARM的NEON指令集等。

方式2:独立的单一架构的加速器。比如GPU、AI芯片

方式3:独立的多架构集成加速器。比如DPU。

方式4:即将开始的一种方式,集成单个或多个加速器。

155fa75a-7f48-11ed-8abf-dac502259ad0.png

这里需要大家区分两个概念:处理器核和处理器芯片。处理器芯片是由同构或异构的处理器核组成的。

CPU已经到了性能瓶颈,这是大家的共识;当CPU遇到性能瓶颈的时候,通过加速的方式进一步提升性能,也是大家的共识。但是,加速的实现形态,是分立的多个芯片,还是集成的单个芯片,就是“仁者见仁智者见智”的事情了。独立的DPU公司会认为,独立的DPU有很多的优势;但是在CPU厂家而言,通过CPU集成加速器核,使得CPU成为某种程度上的类SOC芯片,也是完全可行的。

02独立DPU的价值基础并不牢靠

DPU作为独立的集成加速平台,其价值可以从四个方面进行阐述:

价值一:为了进一步提升性能,DPU实现CPU工作任务的卸载和加速;

价值二:从I/O的硬件虚拟化(也可以看做是I/O模拟的硬件卸载)开始,DPU实现I/O模拟、I/O Workload以及整个虚拟化和基础设施层的全量卸载和加速;

价值三:从运维和管理视角,DPU重要的价值在于实现了业务和基础设施分离,实现了业务主机的安全访问;

价值四:面向更大计算量和数据吞吐量,DPU实现从“以计算为中心”到“以数据为中心”。

157eb41a-7f48-11ed-8abf-dac502259ad0.png

DPU的前三个价值,其实现:可以是独立的DPU芯片实现,也可以是集成的DPU域实现。这对功能和特征没有任何影响,甚至集成的方式,还有一些优势:优化访问效率,提升性能;集成芯片进一步降低成本和功耗。

1593038e-7f48-11ed-8abf-dac502259ad0.png

DPU的第四个价值,一方面,和独立或集成无关,也就是说独立或集成都可以;另一方面,DPU并不一定能够实现以数据为中心的价值。

上面这张图,通常把左边的称为“以计算为中心”,右边的称为“以数据为中心”。然而,这种表述是有问题的。严格来说,左边称为“以CPU为中心”、“以控制为中心”或者“以计算为中心”是可以的,右边这张图称为“以DPU为中心”是合适的,但如果称为“以数据为中心”则是不准确的。“以DPU为中心”并不一定等于“以数据为中心”,“以DPU为中心”,完全可能是“以‘CPU’为中心”,或者说是“以计算为中心”。

最终的结论是:很多DPU其实并非严格意义上的数据驱动处理器,并且即使DPU是数据驱动的,依然无法保证整个计算机系统是完全数据驱动的。

03Intel Sapphire Rapids CPU介绍

15aefa80-7f48-11ed-8abf-dac502259ad0.png

Sapphire Rapids是Intel新一代的数据中心CPU,用于接替Ice Lake。Sapphire Rapids相比Ice lake,从单个TILE变成了4个TILE的Chiplet集成。

Sapphire Rapids可以提供更高的单节点性能:

处理器方面,如更高性能的微架构实现、更多的内核数量、AMX扩展、多个集成的加速引擎等;

存储方面,如更大的私有/共享缓存、DDR5/HBM等;

I/O方面,如采用PCIe 5.0、UPI2.0、支持新一代Optane等;

Chiplet封装:EMIB总线实现多TILE集成。

除了单芯片的性能提升之外,Sapphire Rapids还提供更高的数据中心整体性能,例如快速VM迁移、更强的遥测能力、更强的I/O虚拟化、缓存和内存性能一致性、新一代QoS、CXL1.1、更加的弹性,以及提升资源利用率等等。

而Sapphire Rapids的最大创新则是:AIA。通过AIA集成多种加速引擎,包括数据流加速器DSA(Data Stream Accelerator,不是Domain Specific Architecture)、QAT等。我们将在接下来的一节对AIA详细介绍。

04Intel里程碑:AIA

4.1 背景知识:加速器接口/架构

15db7ea2-7f48-11ed-8abf-dac502259ad0.png

相对于CPU,其他类型的处理器,都可以称为加速处理器,如:GPU、DSA和ASIC等(FPGA需要具体的处理器实现)。这些加速器都是非图灵完备的,因此都需要和CPU组合成Host CPU+xPU的异构计算方式工作。

加速器接口,也即加速器呈现给Host CPU的软件访问接口,也可以称为加速器架构。在这里,架构和接口的概念是等同的。

4.2 AIA技术介绍

AIA(Accelerator interfacing Architecture,加速器接口架构)不是一个简单的功能或特征实现,而是一组相关技术能力的组合(类比Intel的VT-x和VT-d技术)。从Intel新一代Xeon处理器Sapphire Rapids开始,提供加速接口技术AIA,其技术点包括如下:

任务分配指令(MOVDIRI、MOVDIR64B、ENQCMD/S)用于优化任务卸载,ENQCMD/S支持共享任务队列;

用户态等待指令(UMONITOR、UMWAIT、TPAUSE),用于高效同步;

低延迟用户态中断;

共享虚拟内存;

轻量的可扩展I/O虚拟化S-IOV。

AIA目前支持的加速类型有:数据流处理DSA、加解密和数据压缩QAT等。

4.3 Intel AIA的战略意图分析

15ec3260-7f48-11ed-8abf-dac502259ad0.png

作为全能型的处理器,通吃整个计算市场几十年的CPU,面临性能瓶颈的巨大挑战。于是,各种加速处理器,如GPU、DPU等,都在拼命地“挖CPU的墙角”。

作为CPU的霸主,Intel肯定不会“坐以待毙”,一定会“奋起反击”。AIA就是Intel准备的“核弹”级的武器,AIA是Intel CPU的重要里程碑,其战略意图(可能)是:

捍卫CPU的核心地位,所有的一切加速器都需要围绕着CPU技术生态展开;

Intel试图通过AIA统一加速器接口、架构和生态。以GPU作为案例:一方面GPU是独立的架构和生态,与CPU架构是解耦的,可以基于x86架构,也可以迁移到ARM或RISCv架构;另一方面,GPU架构是各自封闭的,NVIDIA有自己的架构和生态,AMD有自己的架构和生态。AIA也许无法把所有的不同加速器类型都统一到一个标准的AIA,但是把GPU统一一个,各种领域加速器DSA各统一一个,是完全可能并且技术上可行的。

一些常见的、关键的加速器,就自己搞定,集成到CPU中,比如Sapphire Rapids集成了数据流处理DSA(DSA可以把很多数据处理类的加速统一进来,如网络和存储等)和QAT,未来再集成AI、网络、存储、虚拟化卸载、安全等基础设施层处理(也即DPU覆盖的范畴)功能或加速器,其可能性也是非常的高。

05Intel CPU的未来发展分析

CPU发展的几个重要里程碑:

里程碑0:CPU的出现。基于简单运算指令的通用处理器,实现软件和硬件的完全解耦。从此后,软件作为独立的工作领域而存在,软件开发人员不用关心硬件细节。

里程碑1:多核CPU,从串行计算走向并行计算。

里程碑2:VT-x和VT-d等CPU硬件虚拟化技术,实现无性能损耗的多租户多系统的独立运行;

里程碑3:AIA技术的出现,通过AIA,支持独立或集成加速器,并且规范加速器的接口/架构和生态。

Sapphire Rapids的出现,第一次从CPU的视角,试图统一各种加速器和CPU的控制和数据交互方式,也即加速器呈现给Host CPU的架构。未来,AIA的方式能否成功,大家拭目以待。

硬件加速,不管是独立或集成的加速引擎/芯片,都是可行的路径。但抛开具体的芯片实现,在架构上,硬件加速的形态会再往何处发展?这里我们抛砖引玉:

标准的交互(Host CPU和加速器的接口或称为架构),统一加速器架构。可能无法把不同类型的加速器统一,但同类型的架构走向统一。

标准交互的同时,需要开放,需要跟CPU架构解耦,可以跨不同的CPU架构实现同样的交互协议;

基于标准的交互,基于一定的机制,要实现业务应用的跨处理器类型运行。

Intel Sapphire Rapids,代表着CPU的一个重要的发展趋势是:CPU芯片不断融合各类加速器核,使得自己成为更加综合和均衡的新型处理器。

06CPU、GPU、DPU,

从竞争/协同到混战/融合

16088028-7f48-11ed-8abf-dac502259ad0.png

目前,CPU、GPU和DPU,数据中心的三大芯片,从“井水不犯河水”,走向“跨越边界,侵入对方领地”的混战阶段。

CPU、GPU和DPU,既是协同的关系,又是竞争的关系。三者处于一个动态平衡的状态,在协同中竞争,在竞争中协同。这个趋势不断发展,走向更加深度地协同甚至融合。

16192e78-7f48-11ed-8abf-dac502259ad0.png

从CPU单个处理器的“合”,走向众多加速器的“分”,再“从分到合”,逐步融合成一个新型的超级处理器。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10719

    浏览量

    209544
  • SoC芯片
    +关注

    关注

    1

    文章

    587

    浏览量

    34763
  • DPU
    DPU
    +关注

    关注

    0

    文章

    347

    浏览量

    24048

原文标题:Intel Sapphire Rapids CPU,吹响反攻DPU的号角

文章出处:【微信号:算力基建,微信公众号:算力基建】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    数据中心应用中适用于Intel Xeon Sapphire Rapids可扩展处理器的负载点解决方案

    电子发烧友网站提供《数据中心应用中适用于Intel Xeon Sapphire Rapids可扩展处理器的负载点解决方案.pdf》资料免费下载
    发表于 09-03 11:20 0次下载
    数据中心应用中适用于<b class='flag-5'>Intel</b> Xeon <b class='flag-5'>Sapphire</b> <b class='flag-5'>Rapids</b>可扩展处理器的负载点解决方案

    数据中心应用中适用于Intel® Xeon® Sapphire Rapids可扩展处理器的负载点解决方案

    电子发烧友网站提供《数据中心应用中适用于Intel® Xeon® Sapphire Rapids可扩展处理器的负载点解决方案.pdf》资料免费下载
    发表于 08-26 09:54 0次下载
    数据中心应用中适用于<b class='flag-5'>Intel</b>® Xeon® <b class='flag-5'>Sapphire</b> <b class='flag-5'>Rapids</b>可扩展处理器的负载点解决方案

    Intel预告下一代至强处理器:Diamond Rapids携LGA9324接口震撼登场

    据8月23日最新消息,Intel 已在紧锣密鼓地准备其下一代至强处理器的安装测试工具,这款代号“Diamond Rapids”的处理器预示着又一轮技术革新。尤为引人注目的是,它将搭载全新的Oak
    的头像 发表于 08-23 14:51 657次阅读

    IaaS+on+DPU(IoD)+下一代高性能算力底座技术白皮书

    DPU 是当下算力基础设施的核心创新之一。如果把 CPU 比做大脑,那么 GPU 就好比是肌肉,而 DPU 就是神经中枢。CPU 承载了应用生态,提供了通用型算力;GPU 提供了高密
    发表于 07-24 15:32

    SAPPHIRE SF NX 简介

      Coherent Sapphire 系列光泵半导体激光器 (OPSL) 正在不断扩展,可在 488 nm 和 532 nm 波长处提供极其稳定的单频输出。 如何让宝石熠熠发辉?Coherent
    的头像 发表于 06-06 06:34 227次阅读
    <b class='flag-5'>SAPPHIRE</b> SF NX 简介

    Intel酷睿Ultra CPU IPC性能实测

    Intel全新的酷睿Ultra号称公司有史以来最具革命性的产品,拥有全新制造工艺、CPU/GPU架构、分离式模块化架构、AI引擎,号称要开启AI PC时代
    的头像 发表于 01-04 09:49 1237次阅读
    <b class='flag-5'>Intel</b>酷睿Ultra <b class='flag-5'>CPU</b> IPC性能实测

    《数据处理器:DPU编程入门》DPU计算入门书籍测评

    一、DPU计算框架 通过一周多的时间翻阅这本书,基本上这本书是一本比较全面的,面向架构的新手指导数据。它在书中详尽介绍了关于DPU在计算机架构中的应用。 对于DPU来说,是一种平行于CPU
    发表于 12-24 10:54

    《数据处理器:DPU编程入门》读书笔记

    首先感谢电子发烧友论坛提供的试读机会。 第一周先阅读了DPU的技术发展背景,了解到DPU是结合了高性能及软件可编程的多核CPU、高性能网络接口,以及各种灵活和可编程的加速引擎。DPU
    发表于 12-21 10:47

    浅谈DPUCPU、GPU的关系

    CPU的一大部分算力卸载给GPU之后,人们发现可以把很多其他功能也外包出去,于是又有了智能网卡,或者叫做DPU
    发表于 12-14 11:44 680次阅读
    浅谈<b class='flag-5'>DPU</b>和<b class='flag-5'>CPU</b>、GPU的关系

    《数据处理器:DPU编程入门》+初步熟悉这本书的结构和主要内容

    dpu:推出的主要意义是为了减轻CPU的数据处理负担,使得cpu可以更具专注自己的通用计算处理运算。 1、DPU数据处理器,演进的核心驱动力是什么? 计算工作负载的不断增长是
    发表于 12-08 18:03

    国科微首款车规级智能视觉芯片通过认证正式进军汽车电子市场

    日前,国科微宣布旗下首款车规级智能视觉芯片通过AEC-Q100认证测试,正式公司进军汽车电子市场的号角
    的头像 发表于 11-24 10:10 1156次阅读

    国科微首款车规级智能视觉芯片通过AEC-Q100认证测试

    日前,国科微宣布旗下首款车规级智能视觉芯片通过AEC-Q100认证测试,正式公司进军汽车电子市场的号角
    的头像 发表于 11-24 10:09 672次阅读

    什么是DPU

    什么是DPU? 相信很多人对于CPU(中央处理器)已经非常熟悉了。灵活、响应迅速的CPU多年来一直是大多数计算机中唯一的可编程元件。 近年来,GPU(图形处理单元)逐渐成为了计算的中心。最初GPU
    发表于 11-03 10:55

    碳中和之路,“风光”无限好

    全球范围内,碳中和的号角已然!各国纷纷加速脚步,迫切地追求能源转型。在这个关键时期,风能、光能以及配套的储能设施正逐渐展现其强大的潜力,并将成为全球科技竞赛的主战场。
    的头像 发表于 11-01 11:55 589次阅读

    【书籍评测活动NO.23】数据处理器:DPU编程入门

    资格! “DPU将是未来计算的三大支柱之一。CPU用于通用计算,GPU用于加速计算,而DPU在数据中心移动数据,进行数据处理。” ——NVIDIA 创始人兼首席执行官黄仁勋于 GTC 2020
    发表于 10-24 15:21