生成式AI带火的不止GPU，网络芯片迎来下一轮大战-电子发烧友网

电子发烧友网报道（文/周凯扬）在生成式AI的热度之下，横向扩展AI训练与推理性能成了每个云服务厂商、数据中心以及互联网厂商追求的目标，这点从前段时间的GPU抢购潮就能看出来，庞大的GPU基数在当下几乎可以和强大的AI算力画上等号。

然而，真正将这些GPU连接起来的，还是靠以太网交换机、路由这类网络芯片。随着数据中心解耦趋势愈发明显，相继认识到这一点的网络芯片厂商都开始新一轮的军备竞赛，诸如博通、美满和思科等厂商都已经加快了新品推出的节奏。

博通Tomahawk

作为在数据中心网络芯片耕耘了12年以上的博通，从640G的Trident系列到25.6T的Tomahawk4系列，已经完成了多次设计迭代，显著提高了网络芯片的带宽。今年三月，博通终于发布了Tomahawk 5系列网络芯片，也是市面上首个量产51.2Tbps交换带宽的芯片。

新的Tomahawk 5系列无疑是在暴涨的AI需求下诞生的，我们从其设计中也能看出。由于做到了更高的端口密度，Tomahawk 5可以实现256高性能AI/ML加速器之间的单跳连接，且每个都能做到200Gbps的网络带宽。这对于数据中心的AI训练和推理的负载来说，无疑提高了吞吐效率，尤其是日益流行且愈发复杂的生成式AI模型。

Trident和Tomahawk芯片路线图 / 博通

在物理设计上，Tomahawk 5采用了如今已经趋近成熟的共封装光学（CPO）方案，相较过去的光模块在前端面板插拔的方案，CPO选择将网络交换芯片和光模块封装在一起。这一封装方案结合5nm的芯片工艺，将功耗进一步降低了30%。

另外值得一提的是，博通的第三条网络芯片产品线，Jericho，也在近期迎来了新品Jericho3-AI。相比以高带宽为重心的Tomahawk产品线，和主打更多功能性的Trident产品线，Jericho往往以较低带宽、深度缓存和高可编程性著称。

而Jericho3-AI虽然确实是28.8T的以太网交换机芯片，却针对AI训练负载做了特殊的优化，更高的端口密度使得Jericho3-AI可以在单个集群中连接32000个GPU，并做到800Gbps的连接带宽表现。博通甚至将其与英伟达自己的InfiniBand方案对比，Jericho3-AI在完成时间上有着10%左右的优势。这也是Jericho系列独有的优势，实现标准以太网芯片无法实现却在AI或HPC应用上被看重的灵活功能。

思科Silicon One

其实早在2019年思科首次推出Silicon One网络芯片时，博通CEO霍克·谭就表示：“思科在该市场的参与，恰巧验证了我们推进的这一行业趋势，也就是数据中心的解耦。我们很高兴自己再次押对了，也欢迎更多的竞争。”要知道，之前的思科可是博通的优质客户之一，如今身份的转变已经对网络芯片的市场格局产生了不小的影响。

Silicon One芯片路线图 / 思科

在第一代自研芯片Silicon One发布三年半之后，思科在近日终于推出了该产品线的第四代产品，以太网交换机芯片G200和G202。其中G200专注于统一架构和基于以太网的AI/ML应用部署，这个采用 5nm工艺打造的芯片，基于512个112Gbps SerDes打造，同样可以做到51.2Tbps的交换带宽。

而G202则是针对想要继续使用50G SerDes的客户打造的，同样基于5nm的工艺，G202采用了512x56Gbps SerDes的配置，其特性与G200完全一致，只不过交换性能只有G200的一半。

根据思科的说法，由于单设备512个100GE以太网端口的超高端口密度，客户可以在一个双层网络上构建由32000个400G GPU组成的AI/ML集群。借助G200打造这样一个庞大的网络，却依然可以省去50%的光学组件、40%左右的交换机，极大减少这类集群的碳足迹，每年最高可以省下900万kWh的耗能。据了解，G200已经送样给六大云服务商中的五家进行测试了。

美满Teralynx

在收购由几位前博通高管打造的芯片初创公司Innovium后，美满也开始了他们的网络芯片逆袭。同样是在今年3月，美满也推出了自己的51.2Tbps交换机芯片，Teralynx 10。相比其他两家，美满为Teralynx 10选择的定位是超低延迟的可编程交换机芯片，这也是此前Innovium的设计目标。

不过直至目前为止，美满并没有将Teralynx并入自己的Prestera产品线内，看来Prestera应该还是主打企业与边缘数据中心市场，而面向云端数据中心的Teralynx系列继续沿用原来的产品线名称。

除了用到业界顶级的112G SerDes IP和先进的工艺实现低功耗的系统设计以外，美满电子宣称Teralynx 10可以提供1.7倍的延迟优势，这对于生成式AI这种看重完成时间和网络传输时间的应用来说至关重要。

企业与数据中心的交换芯片方案 / 美满

还有一点与其他两家不同的是，Teralynx 10可以驱动128个400Gbps端口、64个800Gbps端口和32个1.6Tbps端口，1.6Tbps的端口驱动能力可以说是放眼未来了，这也意味着Teralynx 10可以直接在1RU大小的机柜中实现51.2Tbps的性能。

为此，美满也推出了Nova这一业界首个做到1.6Tbps的PAM4电光平台，Nova基于美满的200Gbps/lambda光DSP打造，足以为1.6Tbps的可插拔光模块提供支持。由于DSP的带宽翻倍，基于Nova的光模块不仅减少了所需激光和相关光学组件的数量，相较其他的方案来说稳定性也同样加倍。虽然800Gbps的光模块仍在普及中，但要想在下一代数据中心交换网络中抢占先机，1.6Tbps的光模块也该尽快提上日程了。

写在最后

之所以这些厂商都能这么快推出下一代高性能网络芯片，其实还是靠EDA/IP和封装技术打好了第一波基础，厂商们先一步推出了完善的以太网IP和共封装光学方案。不过这也意味着过去数据中心交换硬件很可能迎来新一波的换代，从目前来看应该是只有大型云服务厂商有这个资本进行大规模替换。

但除了这些网络芯片公司之间的斗争之外，他们也需要提防英伟达这样既有GPU业务又有网络芯片业务的厂商。以上提到的这三家在推出的新品上都有剑指英伟达InfiniBand的意思，毕竟后者从一开始就是为了HPC和AI打造的通信标准，而它们则是刚从Web Scaling转向AI Scaling，从外部网络交换转为内部网络交换，仍需要不断提升产品性能才能在这个竞争激烈的市场上存活下去。

不过这也可以看出AI带来的热度，因为无论是从软件还是从硬件上，产品的迭代速度都有了成倍提升。800GbE时代的到来，也导致所有想在服务器市场创造增长的厂商纷纷趋之若鹜，好在这样的趋势恰恰是服务器市场急需的一剂强心剂。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
4729

浏览量
128902
AI

AI

+关注

关注
87

文章
30763

浏览量
268914
生成式AI

生成式AI

+关注

关注
0

文章
502

浏览量
471

安霸发布全新N1系列生成式AI芯片

安霸在CES 2024上发布了全新的N1系列生成式AI芯片，这是一款专门为前端设备设计的芯片，支

发表于 01-09 15:32 •1365次阅读

搜索历史

生成式AI带火的不止GPU，网络芯片迎来下一轮大战

评论

生成式AI带飞，三大存储产品齐涨价

Lunar Lake大战Strix Point！AMD、英特尔掀起新一轮AI PC芯片“大跃进”

雷诺下一代车载语音助手Reno将引入生成式AI技术

荣耀迎来新一轮投资,中国电信、中金资本等加入

生成式AI工具作用

生成式AI与神经网络模型的区别和联系

亚马逊云科技携手SAP通过生成式AI解锁创新潜力

原来这才是【生成式AI】！！

赛轮思与NVIDIA合作，利用生成式AI打造下一代车内体验

丰田、日产和本田将合作开发下一代汽车的AI和芯片

生成式AI如何重塑通信业？爱立信最新尝试给出了答案

NPU是什么？为何它是开启终端侧生成式AI的关键？

高通NPU和异构计算提升生成式AI性能

生成式 AI （3/4）：如何缓解人才短缺，促进芯片设计多元化？

安霸发布全新N1系列生成式AI芯片