服务器行业将需要证明异构计算的有效性-电子发烧友网

服务器中的CPU数量正在增长，制造这些处理器的供应商数量也在增加。

除了IBM的Power和Z系列是主要的例外之外，CPU服务器一般是多核的x86处理器。尽管不一定要更换x86处理器，但它们会通过新的处理器设计得到补充和扩充，以用于各种更专门的任务。

在最近的Top500超级计算机列表中，有140个超级计算机具有Nvidia GPU协处理器，而且这个数字只会增加。在未来5到10年内，通用服务器将随x86处理器，GPU，FPGA，Arm内核，AI协处理器，5G调制解调器和网络加速器一起交付。

这是公认的一种尺寸并不能完全适合应用程序处理。终端市场可能会四分五裂，所有这些都要求定制化的解决方案。结果，一定会导致计算的未来（尤其是在服务器端）是异构的。

TECHnalysis Research总裁兼首席分析师Bob O‘Donnell说：“人们发现，不同的芯片架构更适合于处理不同类型的工作负载。而且由于这种工作负载的多样化将继续，因此对多样化计算的需求也将继续。将会有其他必要的芯片。这并不意味着CPU会大量消失，但是其他类型的芯片将会有更多的多样性。然后最大的问题将是互连封装。”

英特尔在其XPU项目中采取了积极的态度，该项目将CPU，GPU（通过其新的Xe GPU），Altera的FPGA和AI处理器与API结合在一起。英特尔数据中心XPU产品和解决方案副总裁兼总经理Jeff McVeigh说：“我认为未来的发展不会有一个统一的答案。但是会有很多种类型，从紧密集成的单片芯片到集成到系统级连接的多芯片封装。”

Nvidia企业计算部门负责人Manuvir Das认为：“对不同计算体系结构的需求是由新数据类型驱动的。每个公司都有越来越多的数据可供使用。而且公司越来越愿意收集越来越多的数据。这样做的原因是因为他们现在可以看到他们可以从数据中获取价值。”

近几个月来，随着公司通过购买而非自然增长实现产品多样化，半导体行业见证了相当大的并购活动。

英伟达（Nvidia）是一家多年来未曾进行大笔收购的公司，它突然打开了钱包，以70亿美元的价格收购SmartNIC制造商Mellanox，以400亿美元的价格收购ARM Holdings。

AMD计划以350亿美元的价格收购Xilinx，这是多年来的首次重大收购行动。

Marvell Technology以60亿美元收购了Arm服务器芯片制造商Cavium，并以100亿美元收购了网络半导体制造商Inphi。

ADI公司已经签署了一项协议，以210亿美元的价格收购Maxim Integrated产品。

O’Donnell说：“他们之所以多样化，是因为他们都认识到必须拥有各种各样的不同芯片架构。最困难的部分将是英特尔要使用一种API来做的事情，那就是，我如何采用这些多样化的架构，并使它们可供人们使用？每个架构都需要不同的指令集，不同的编程方式，不同类型的编译器等。”

一个或多个芯片？

那么问题就变成了主板上是否会有一块大硅片，或者每个芯片组有多个插座？这几乎不是一个新主意。片上系统（system-on-chip）已经存在多年。但是SoC正在发生变化。

SoC设计通常会缩减处理器，尤其是GPU，以使所有这些芯片都适合合理的散热范围。仅具有完整CPU，GPU和FPGA的SoC的TDP约为700瓦，这对任何人来说都是完全没有吸引力的。如果要进行包装设计，则很可能会缩小处理器的规模。

系统和解决方案副总裁兼Rambus杰出发明家Steven Woo表示：“AMD已经做了一些伟大的工作，表明可以将小芯片封装用于CPU内核和I/O芯片。而且，如果您想获得更强大的功能，则可以构建整个小芯片，这些小芯片可能只是CPU内核，一个是更多的神经网络引擎，也许是GPU，然后可以将它们组合在一起。”

英特尔的McVeigh可以选择采用多封装设计。“从存储器带宽的角度来看，单封装设计显然有好处，但是在每个封装中可以装多少东西也有限制。因此，我认为未来的发展不会有一个单一的答案。但是，从紧密集成的单片芯片到集成到系统级连接的多芯片封装，将有多种选择。”他说。

英伟达也对多芯片封装的想法持开放态度，尽管它的愿景与英特尔类似。它提供所有的硅。Das指出，英伟达已经拥有Tegra形式的Arm/GeForce SoC，以及结合了Mellanox ConnectX-6网络控制器，Arm CPU和Ampere GPU的新型Bluefield 2数据处理单元（DPU）系列。按照Nvidia的发展路线图，2022年的BlueField 4将在一块硅片上配备所有三个CPU。

“如果仅考虑从现在起三年后以及从现在起五年后将要完成的计算量，那么如果您不这样做的话，世界将负担不起。因此，将有多种形式。当您靠近边缘时，它将看起来将更倾向于集成解决方案，” Das说。

但这就是英特尔和英伟达将自己所有的IP包装到一块硅中。当两家或更多公司合作的前景（例如，Marvell和AMD）时，这种观点是令人怀疑的。

Supermicro的FAE和业务开发高级副总裁Vik Malyala表示：“这将非常困难。为什么英特尔或AMD会向Nvidia开放有关其处理器架构的所有内容？英伟达也是如此。Nvidia为什么要开放其GPU的所有功能以与某人一起工作？所以说他们试图购买Arm是有原因的。”

Arm基础设施业务部门的营销高级总监Eddie Ramirez表示，多供应商芯片是有先例的。“如果您要看10年前的事，我们几乎还没有将您的设计与制造分开的初期阶段。对于现在的SoC，这是司空见惯的。因此，在您谈论的时间范围内，在5到10年内，生态系统将发展到可以使用来自不同供应商的硅片构建FCM的地步。”他说。

但是，他质疑鉴于不同的芯片具有不同的使用寿命，这是否是一个好主意。“拥有一台带有PCI卡的服务器是一回事，您可以更换卡。但是，当它们装在一个包装中时，您必须立即更换所有东西。这适用于不同的生命周期吗？这是这里的有趣之处。”他补充说。

Malyala还指出，芯片供应商针对不同的性能场景提供了多种芯片，将一大堆集成到一个封装中会限制客户的选择。例如，如果我是Xilinx，那么我有十几个不同的FPGA。但是，如果我要在给定的硅片中放置一个硅片，那就是说这就是它的原样，即使我的配置过多或配置不足，我也坚持这样做。

CXL公式

服务器中非CPU处理器的当前解决方案是PCI Express卡。GPU，SSD，FPGA和其他协处理器占用一个PCIe插槽，并且服务器中只有太多空间可用于存储卡，尤其是超薄1U和2U设计。

PCIe还具有作为点对点通信协议的局限性。由于Compute Express Link（CXL）协议可与PCIe以及其他自动协商交易协议一起使用，因此已迅速成为PCIe的替代协议。

McVeigh说：“当我们进入这些更复杂的体系结构时，真正需要的是可以支持对等通信的各种拓扑，以及能够扩展这些拓扑的能力。PCI Express本身并不能解决所有这些问题。但是，对于您希望能够进行升级的情况，显然是从现有设计中升级，即您拥有单独的卡，并且可能不需要完全的互连性，那么在那儿做得很好。”

CXL的一大优点是它通过其快速连接将加速器放置在距离处理器更近的位置，更重要的是，它使连接到加速器的内存成为系统内存的一部分，而不是专用设备内存。这可以减轻系统内存的负担，并减少必须移动的数据量，因为设备内存（例如GPU）中的数据很容易看到，而无需在系统内存之间来回移动。

无论多个处理器是在单个裸片上还是在多个裸片上，它们都必须以某种方式绑在一起，并且CXL被视为将它们绑定在一起的网格。PCIe有其用途，但它是点对点协议，而不是像CXL这样的网格。另外，CXL允许处理器共享内存，而PCIe则无法做到这一点。

“ CXL绝对是非常可信的，” Rambus的Woo说。“如果行业真正围绕它发展起来，那将是新型互连发展的垫脚石，我们将围绕节点之间相互连接所发生的事情对它进行更大程度的优化。也许将处理器连接到内存和分解方案，甚至将处理器连接到GPU和存储之类的东西。”

Ramirez说，CXL出现的一个例子是在具有PCIe的不同端点之间具有一致的内存访问的概念。如果您试图在一个加速器上进行一定数量的计算，并且需要与其他加速器进行通讯，则它们应该能够直接讲话，而不是使用“轮辐式”模型，在该模型中，一切都必须花一点时间才能完成。协调。拉米雷斯说：“ PCI Express本质上不具备该功能。”

可能会有一种全新的标准在PCIe的良好组成部分基础上发展，而忽略了不需要的部分。Woo指出，当两个PCI Express设备首先开始互相通信时，它们使用PCIe Gen 1进行协商，然后逐步升级，直到找到可以通话的最高速度。

Woo说：“整个初始化序列要麻烦一些。如果您从芯片设计师的角度考虑问题，必须把所有这些Gate都放进去，它们将习惯于弄清楚我可以更快地讲话，并且我不再使用那些晶体管了。拥有这种简单的协议是有好处的。作为硅设计师，我宁愿将这些Gate用于其他用途。”

一个可以统治所有应用程序的API

而没有软件的硬件只是一堆金属，因此，这些工作背后的真正问题是如何将它们组合在一起。英特尔的oneAPI程序提供了最完整的解决方案。oneAPI提供了用于计算和数据密集型领域的库，例如深度学习，科学计算，视频分析和媒体处理。

oneAPI可与用C，C ++，Fortran和Python编写的代码以及MPI和OpenMP等标准进行互操作。它还具有一组编译器，性能库，分析和调试工具，以及一个兼容性工具，该工具有助于将以CUDA编写的代码迁移到Data Parallel C ++（DPC ++），这是一种基于C ++和Khronos SYCL构建的开放式标准跨体系结构语言。

DPC ++扩展了这些标准，并提供了显式的并行构造和卸载接口，以支持各种计算体系结构和处理器。当然，它支持英特尔，但McVeigh说，他希望其他芯片公司也采用它。

McVeigh说：“我们将其视为一项行业计划，将这些异构架构与统一的编程模型结合在一起。而且我们已经将其用作真正结合这些架构的关键要素，因此您可以使用一种通用语言，一套与OS供应商解决方案一起使用的通用库（不仅是英特尔产品）对它们进行编程。”

O‘Donnell相信，该软件解决方案将全面存在，从BIOS和驱动程序供应商到Linux发行版，如Red Hat Enterprise Linux和Canonical的Ubuntu。他说：“这是一个如此多层的堆栈。现在，它是全面的。我认为您不会看到任何解决方案。涉及的部分太多了。”

结论

服务器行业将需要更多的证明点来证明异构计算的有效性。但这不是寻找市场的解决方案。存在着许多市场，随着边缘的推出，正在开发新的市场。所发生的变化是，解决方案是针对它们量身定制的，而不是最终市场适应现有的最佳现成技术。

O’Donnell说：“从概念上讲，我们将需要不同的芯片体系结构才有意义。我们需要一个单一的软件平台来利用它们，但是在这种硬件抽象层以及其他所有东西的幕后，它需要采取某种神奇的方式。”

随着人们开始使用多芯片架构，我们是否将开始看到它按他们期望的方式工作？我们是否正在获得人们期望的性能优势？划算吗？在现实世界中这实际上是如何工作的？

他说：“除了理论之外，这还有待观察。” “我们将不得不在多个层面上看到这一点。英特尔将驱动它，但是您也会看到其他公司也尝试驱动它。”

原文标题：服务器以后会变得越来越异构？

文章出处：【微信公众号：存储社区】欢迎添加关注！文章转载请注明出处。

责任编辑：haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英特尔

英特尔

+关注

关注
61

文章
9906

浏览量
171567
服务器

服务器

+关注

关注
12

文章
9037

浏览量
85221

原文标题：服务器以后会变得越来越异构？

文章出处：【微信号：TopStorage，微信公众号：存储加速器】欢迎添加关注！文章转载请注明出处。

云服务器主要应用行业及优势

云服务器作为一种基于云计算技术的虚拟化计算资源，正逐渐成为众多行业数字化转型的重要支撑。它不仅提供了灵活的资源配置，还带来了诸多传统物理服务器

发表于 10-31 09:24 •151次阅读

最强服务器CPU来了！AI性能直接翻倍

以及AI服务器及AI数据中心场景的CPU产品。它不仅能支持广泛的第三方GPU及AI加速器，与它们组合形成强大的异构计算平台，还能在其中补足GPU或专用加速器覆盖不到或不足的地方，为更多

发表于 09-29 11:00 •694次阅读

什么是AI服务器？AI服务器的优势是什么？

AI服务器是一种专门为人工智能应用设计的服务器，它采用异构形式的硬件架构，通常搭载GPU、FPGA、ASIC等加速芯片，利用CPU与加速芯片的组合来满足高吞吐量互联的需求，为自然语言处理、计算

发表于 09-21 11:43 •678次阅读

华纳云：如何正确配置PDSoft数据库服务器以优化性能？

如何监控和测试这些机制的有效性。通过有效的设置，可以大幅提升系统的稳定性和恢复能力。 1. 冗余服务器架构 1.1. 主从架构主从架构是一种基本的冗余配置，其中一台服务器充当主

发表于 09-19 15:54 •211次阅读

云服务器搭建详细过程

随着云计算技术的发展，越来越多的企业和个人开始选择使用云服务器来部署自己的应用和服务。相比于传统的物理服务器，云服务器提供了更高的灵活性、可

发表于 09-12 10:00 •286次阅读

打造异构计算新标杆！国数集联发布首款CXL混合资源池参考设计

参考设计是首个支持异构计算架构的CXL硬件设备，标志着CXL技术在数据中心领域迎来异构计算新阶段。国数集联基于FPGA与自主研发的CXL协议IP的先进特性，可实现CPU、GPU、DDR、SSD

发表于 08-06 14:19 •285次阅读

AvaotaA1全志T527开发板AMP异构计算简介

Avaota SBC 的部分平台内具有小核心 CPU，与大核心一起组成了异构计算的功能。在异构多处理系统中，主核心和辅助核心的存在旨在共同协作，以实现更高效的任务处理。这种协作需要系统采取一系列

发表于 07-24 09:54

异构计算：解锁算力潜能的新途径

在这个数据爆炸的时代，计算力是推动社会与科技创新的核心。从日常智能设备的流畅运行到超级计算机的尖端模拟，均依赖强大的计算能力。但面对多样化的复杂计算任务，单一处理

发表于 07-18 08:28 •7791次阅读

AI服务器异构计算深度解读

AI服务器按芯片类型可分为CPU+GPU、CPU+FPGA、CPU+ASIC等组合形式，CPU+GPU是目前国内的主要选择（占比91.9%）。

发表于 04-12 12:27 •576次阅读

高通NPU和异构计算提升生成式AI性能

异构计算的重要性不可忽视。根据生成式AI的独特需求和计算负担，需要配备不同的处理器，如专注于AI工作负载的定制设计的NPU、CPU和GPU。

发表于 03-06 14:15 •747次阅读

linux服务器和windows服务器

较为熟悉，需要高性能和稳定性，并且希望能够进行自定义配置和更好的安全性，那么Linux服务器是一个不错的选择。而如果你对服务器操作系统不太熟悉，

发表于 02-22 15:46

物理服务器对ai发展的应用

物理服务器在AI发展中扮演着重要的角色。传统的以CPU为计算部件的服务器架构已难以满足人工智能的新需求，因此，"CPU+ GPU/FPGA/ASIC"的异构计算架构成为人工智能

发表于 12-22 09:19 •429次阅读

　物理服务器和大宽服务器怎么选

物理服务器和大宽服务器的选择需要根据具体的业务需求来决定。物理服务器是一种独立的、非虚拟化的计算机设备，它通常被用作高性能应用、数据库、存储

发表于 12-20 10:50 •552次阅读

高防服务器和普通服务器之间的区别是什么

，和通用的计算机架构类似，但是由于需要提供高可靠的服务，因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。在网络环境

发表于 12-15 14:37 •593次阅读

gpu服务器是干什么的 gpu服务器与cpu服务器的区别

　相比于传统的CPU服务器，GPU服务器支持同时计算大量相似的计算操作，可以实现更强的并行计算性能。GPU

发表于 12-02 17:20 •1877次阅读