超大规模数据中心要回到ASIC岁月么？-电子发烧友网

数据中心处理器正在重新架构、定制化和多样化。当超大规模数据中心开发他们自己的芯片时，以前为他们服务的芯片公司应如何应对？定制化是正确的方向吗？

由于Amazon、Google和Meta等超大规模数据中心的推动，数据中心芯片的多样化和定制化趋势日益加剧。

他们试图绕过传统芯片设计师的做法为芯片行业带来了担忧。

这些担忧是有道理的。

打入超大规模数据中心处理器市场对传统芯片公司和初创公司提出了挑战。这部分是因为超大规模数据中心要求专为其算法和工作负载而定制的特定硬件解决方案。拥有专有软件的超大规模数据中心也具有不公平的竞争优势。

重新架构数据中心

首先，让我们分析一下当前数据中心处理器市场的现状。

根据Yole Intelligence科技与市场分析师Adrien Sanchez的说法，如今有两种主要类型的处理器进入数据中心。“一种是CPU，另一种是加速器。”

在CPU类别中，主要竞争对手是Intel和AMD。新玩家如Ampere和Nvidia也开始出现，一些中国玩家也加入了该行列。但关键是，一些超大规模数据中心如AWS和阿里巴巴已经开发了自己的定制CPU。

另一方面，加速器有几个子类别。它们包括：

由Nvidia和AMD主导的GPU/图形加速器。

通用图形处理单元（GPGPU）和AI加速器，同样由Nvidia和AMD主导。Yole的Sanchez表示，Intel目前也在为这个子类别开发新产品。这也是许多AI硬件初创公司争相推出产品的领域。几乎所有的超大规模数据中心也都有自己的定制处理器，专门用于加速AI训练与推理。

数据处理单元（DPU）/智能网络接口卡（NIC）开始用于加速数据和网络工作负载。Sanchez表示，这个子类别的主要竞争对手包括Broadcom、Marvell、Nvidia（Mellanox产品线）、AMD（既有Xilinx，又有Pesando处理器）和Intel。一些超大规模数据中心如AWS和阿里巴巴也有自己的产品。

Tirias Research的首席分析师Steve Leibson解释说：“数据中心架构已经在发生变化，特别是在加速器的应用上。”

例如，根据Lebson的说法，Microsoft Azure一直将FPGA置于其基础架构的核心，寻求利用其增加的灵活性。他补充说：“AWS多年来一直将FPGA加速作为实验提供给客户。”他还说：“最近，随着AI特别是ChatGPT的出现，Nvidia的GPU已经在加速器竞赛中处于核心地位，Nvidia正投入大量资源进行数据中心架构的开发。”

Leibson认为“安全性”是推动数据中心重新架构的另一个因素。Leibson解释说，Intel和AMD正在推动DPU，Intel称之为基础设施处理单元（IPU），因为它们可以将基础设施任务从服务器CPU中移除。目标是阻止恶意行为者试图访问关键数据。DPU/IPU和智能NIC位于服务器领域之外。

定制化趋势正在发生吗？

在这种背景下，数据中心处理器的多样化正在迅速展开。像Marvell和Broadcom这样的公司认为，这种变化让芯片行业的老业务模式定制ASIC重新焕发生机。

他们计划推动定制化来帮助超大规模数据中心。他们的战略首先从超大规模数据中心处理器的边缘开始，试图用自己的IP进行渗透。

Marvell最近推出的高速、超高带宽SerDes采用了TSMC的3nm工艺生产，就是一个例子。

像I/O模块、存储器、SerDes和互连这样的IP并不是定制化超大规模数据中心芯片中最引人注目的元素。但是，利用像Marvell这样的公司已经可以获得的IP，使得超大规模数据中心更容易加速其数据中心芯片的定制化。

然而，与Nvidia、AMD和Intel在数据中心更广泛产品组合中取得的更深入进展相比，Marvell在数据中心的进展规模相形见绌。

瓶颈点

Marvell认为“定制化正成为客户业务的核心”。

Marvell的计算与定制集团技术副总裁Mark Kuemerle观察到：“关于这些数据中心客户的有趣事实是，如果他们的系统中出现轻微的瓶颈点，问题会被放大1000倍甚至更多（因为它们部署在超大规模中）。”这样的瓶颈点可能导致NIC卡住。现成的机器学习设备可能无法匹配工作负载或满足灵活性或可编程性的需求。

Kuemerle说：“这些超大规模数据中心真的必须将一切精确调整到他们的工作负载。那么，他们投资建设定制芯片绝对是值得的。”

Kuemerle表示，这些客户还需要解决方案来覆盖他们构建的所有内容，“从基础NIC到视频加速，再到大规模机器学习”。

回到ASIC了吗？

等一下。Marvell的这种方法不是让芯片行业回到了ASIC的黑暗时代吗？

在20世纪90年代，领先的芯片公司渴望设计和提供针对特定应用的定制ASIC设备，同时提供更好的性能。Sony、Toshiba和IBM最初设计的用于Sony Playstation 3的Cell Processor就是一个例子。

但那些ASIC的岁月已经过去了。为特定产品设计ASIC变得越来越难以合理规模。坦率地说，人们开始讨厌ASIC。那么，情况发生了什么变化，数据中心公司真的需要定制芯片吗？

Marvell新成立的计算与定制集团高级副总裁Kevin O'Buckley承认，对ASIC的反感确实出现了。但他坚称，只有当系统公司试图将真正先进的工艺节点应用到他们自己的ASIC时，才产生了这种看法。那对任何人来说都变得过于昂贵。

但如今，当摩尔定律放缓时，寻求更先进的工艺节点不再是潜在ASIC客户的唯一选择。客户可以选择2.5D、3D芯片或芯片组，混合匹配不同的IP、硬件和封装技术。

有鉴于此，O'Buckley认为，“从收入、SAM（serviceable available market）和TAM（total available market）来看，ASIC市场实际上从未如此庞大。”

当然，O'Buckley承认，从投资回报来看，可以承受投资的客户和应用的整合实际上正在缩小。尽管芯片制造商竞标的领域数量减少，项目数量减少，但他强调，“这些单个领域的价值和影响正在爆炸式增长。”

对定制芯片的怀疑仍然存在

Tirias Research的Leibson对主要芯片公司正在忙于定制他们的GPU和CPU以适应特定超大规模数据中心客户的需求持怀疑态度。

Leibson表示：“他们可能会这样做，但我认为这些公司更有可能与超大规模数据中心讨论需求，并尝试提供满足聚合需求的标准设备。”在他看来，定制芯片是为客户量身定制的芯片，正如Intel与Google合作开发Mt. Evans ASIC IPU那样。

对于芯片公司来说，这是否具有商业意义又是另一个问题。毕竟，芯片供应商必须寻找规模大的机会。

Yole Intelligence的技术与市场分析师John Lorenz表示赞同：“在某种程度上，AMD和Intel正在提议更多的硬件定制，例如AMD的MI300系列和Intel的Rialto Bridge系列，客户可能会寻找不同的CPU、GPU和XPU组合，以根据他们的需求定制计算解决方案。”他补充说，“相比之下，Nvidia解决方案的更多灵活性来自CUDA软件，硬件方面较少。尽管如此，我们应该看到Grace和Hopper的一些组合作为某些硬件选项。”

Yole的Lorenz和Tirias Research的Leibson都不确定AMD是否计划将其半定制芯片业务（目前专用于游戏机芯片）扩展到一些不同领域。

然而，一年前，在AMD的财务日上，Lisa Su阐述了她的雄心。“在过去的10年里，我们一直从事定制芯片业务。如果你看看我们在游戏机市场所做的事情，那就是定制芯片，将我们的芯片带给我们客户对市场、系统和软件应用的愿景。我认为，定制芯片的趋势只会继续增长。”

Lisa Su表示，AMD的一些超大规模数据中心客户正在寻求AMD的帮助为自己的芯片进行差异化。然而，AMD的定制芯片项目的细节尚未公开。

超大规模数据中心定制芯片的需求将继续存在。对于超大规模数据中心来说，定制ASIC是有意义的。然而，如果相关ASIC只成为一次性解决方案，那么像Marvell这样尝试定制策略的芯片公司能否在这样的不确定性趋势中寻找的规模机会就不得而知了。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

处理器

处理器

+关注

关注
68

文章
19259

浏览量
229652
存储器

存储器

+关注

关注
38

文章
7484

浏览量
163763
加速器

加速器

+关注

关注
2

文章
796

浏览量
37840
DPU

DPU

+关注

关注
0

文章
357

浏览量
24169
ASIC芯片

ASIC芯片

+关注

关注
2

文章
91

浏览量
23760

原文标题：超大规模数据中心要回到ASIC岁月么？

文章出处：【微信号：Astroys，微信公众号：Astroys】欢迎添加关注！文章转载请注明出处。

伟创力收购数据中心液冷公司JetCool Technologies

近日，伟创力宣布收购领先的数据中心液冷公司JetCool Technologies。此次收购增强了伟创力的数据中心和电源产品组合，以帮助超大规模和企业客户解决人工智能时代日益增长的电力、热量和

发表于 11-30 16:16 •548次阅读

纳微半导体发布全球首款8.5kW AI数据中心服务器电源

采用了氮化镓和碳化硅技术的混合设计，实现了>97.5%的超高效率，完美适配AI和超大规模数据中心。

发表于 11-08 11:33 •441次阅读

高效数据中心升级：400G光模块测试与采购策略

随着移动互联网、云计算、大数据等技术的迅猛发展，数据中心和云计算资源的需求呈现出爆炸性增长。这一趋势不仅极大地推动了核心网络传输带宽的需求增长，也催生了超大规模云数据中心的快速发展。

发表于 11-06 16:22 •274次阅读

Zettabyte与纬创携手打造台湾首个超大规模AI数据中心

在推动亚太地区AI计算领域迈向新纪元的征程中，Zettabyte与纬创资通（Wistron Corporation）携手宣布了一项重大合作——共同建设台湾地区首个超大规模AI数据中心，这一里程碑式的项目不仅标志着台湾AI基础设施的飞跃，也预示着亚太区AI计算格局的深刻变革

发表于 09-05 16:26 •380次阅读

谷歌正在考虑在越南建设超大规模数据中心

据可靠消息透露，Alphabet集团旗下的谷歌公司正积极筹划在越南南部的经济枢纽胡志明市周边建设一座“超大规模”数据中心。此举标志着美国科技巨头首次在东南亚国家进行此类重大投资，尽管具体的投资金额尚待揭晓。

发表于 08-30 14:55 •615次阅读

超大规模集成电路（VLSI）中不可或缺的5种二极管

在快速发展的超大规模集成电路（VLSI）设计世界中，选择正确的组件对于优化性能和效率至关重要。二极管在超大规模集成电路的各种应用中起着不可或缺的作用，从整流到电压调节。本文深入研究了2024年

发表于 08-20 18:28 •821次阅读

新思科技1.6T以太网IP解决方案推动数据中心发展

我们每天都在搜索引擎中搜寻大量信息，并期望在短短几秒钟内得到大量的相关信息，超大规模数据中心需要处理海量数据、经历复杂的流程和完成各种各样的处理工作。如果您是设计数据中心SoC的开发者，肯定会敏锐地

发表于 08-12 10:29 •441次阅读

有哪些技术影响超大规模数据中心建设

从AWS的百亿美元投资到Meta的八亿美元布局，再到微软在德国的数十亿欧元承诺，以及Alphabet在英国的新数据中心扩张，这些科技巨头正竞相构建数字世界的坚实基石。

发表于 07-30 11:15 •486次阅读

SAS 24G+规范发布,为超大规模数据中心HDD和SSD

在当前超大规模数据中心的演进历程中，尽管固态硬盘正日益向支持NVMe协议的PCIe接口转型，但串行连接SCSI（SAS）技术依然是众多关键应用不可或缺的支柱。SAS存储技术的生命力远未枯竭，这一点从

发表于 07-25 15:13 •775次阅读

燧原科技与清程极智携手共创AI未来：共筑超大规模智算集群新篇章

在人工智能（AI）技术日新月异的今天，高性能计算与大规模数据处理成为推动行业变革的关键力量。今日，国内领先的AI芯片及解决方案提供商燧原科技与人工智能系统软件领域的佼佼者清程极智宣布签署战略合作

发表于 07-05 14:50 •776次阅读

华为云华东(芜湖)数据中心正式开服

近日，华为云华东（芜湖）数据中心正式投入运营，这一里程碑事件不仅标志着华为云全国存算网枢纽节点布局的全面完成，更意味着“东数西算”战略在长三角区域迎来了重要的发展节点。该数据中心作为关键枢纽，将向华东及中部区域提供前所未有的超大规模

发表于 06-15 09:45 •532次阅读

数据中心选择光纤时的考虑因素

传输速率国内数据中心内的服务器端口速率已迈入从10Gbps/25Gbps向100Gbps及更高速率的过度阶段，一些中大型数据中心已经在部署400Gbps传输连接，一些超大规模数据中心甚至已经在规划

发表于 05-07 10:04 •368次阅读

超大规模数据中心采用三星FDP SSD降低存储成本

主机数据放置技术一直是超大规模数据中心关注的话题，因为它影响所部署的SSD的总体拥有成本（TCO）。

发表于 03-07 15:39 •1904次阅读

晶晟微纳发布N800超大规模AI算力芯片测试探针卡

近日，上海韬盛科技旗下的苏州晶晟微纳宣布推出其最新研发的N800超大规模AI算力芯片测试探针卡。这款高性能探针卡采用了前沿的嵌入式合金纳米堆叠技术，旨在满足当前超大规模AI算力芯片的高精度测试需求。

发表于 03-04 13:59 •1014次阅读

中国电信规划在上海建设首个国产超大规模算力液冷集群

中国电信规划建设首个国产超大规模算力液冷集群人工智能技术的快速发展催生了巨大的算力需求；中国电信规划在上海规划建设可支持万亿参数大模型训练的智算集群中心。其中会搭载液冷技术，单池新建国产算力达10000卡，也是首个支持单池万卡的国产超

发表于 02-22 18:48 •1327次阅读