英伟达发布采用NVLink-C2C技术的Grace Superchip芯片-电子发烧友网

电子发烧友网报道(文/周凯扬)英伟达在GTC22上发布了全新的Grace Superchip，该芯片中用到了NVLink-C2C技术，而去年公开的Grace Hopper Superchip同样用到了这一技术。根据英伟达超大规模计算部门副总裁Ian Buck的说法，Chiplet和异构计算已经成了解决摩尔定律缓慢进展的两大有效手段。而NVLink-C2C这一面向die和chip的互联技术，成了英伟达对愈发普及的Chiplet设计的回应。

Superchip的互联

也许在不少人看来的印象中，提到NVLink会想到下图这个桥接多个高端显卡或专业显卡的RTX NVLink Bridge，其实NVLink这一技术在服务器级别的GPU中反倒更为普遍。从P100的第一代NVLink，到V100的第二代NVLink，A100的第三代NVLink，最后再到如今H100的第四代NVLink。NVLink可以说是跟着GPU架构一路推陈出新了，如今享受第四代NVLink性能的成了Hopper架构的GPU。而在英伟达的SERDES和LINK技术发展下，NVLink也从PCB、MCM走向了硅中介层和晶圆，也因此有了NVLink-C2C。

Grace Superchip显然用的是ARM Neoverse N2这一基于Arm v9架构的设计，但从芯片图可以看出，单个Grace Superchip芯片由两个Grace CPU组成，才让总核心数达到了144。而这两个CPU组成的方式，正是NVLink-C2C这一互联技术。我们在开头已经提到，去年公开的Grace Hopper Superchip同样使用了这一互联技术，只不过当时单个Grace Hopper Superchip芯片中互联的，是一个Grace CPU和一个Hopper GPU。

NVLink-C2C为英伟达带来的远不止这样一对一的互联方案，而是一整套系统架构上的创新。在NVLink-C2C的支持下，英伟达可以选择一个Grace CPU，两个Hopper GPU的设计，或是两个2个Grace CPU+2个Hopper GPU，甚至是2个Grace CPU+8个Hopper GPU。可以看出，NVLink-C2C为Grace和Hopper在数据中心和HPC应用提供了极大的扩展性。

远超PCIe 5.0的性能

英伟达强调，NVLink-C2C具有前所未有的性能，比如处理器与加速器之间900GB/s的高带宽数据传输，以及快速同步和高频率更新下的超低延迟，以及在先进封装英伟达芯片下，能效比可以做到PCIe 5.0的25倍，面积效率更是达到90倍。

NVLink-C2C 900GB/s的带宽确实优秀，也与第四代NVLink的性能一致，但这并不代表只要用上NVLink就能获得，我们从Hopper架构的GPU H100的参数上也能窥见一二。要想获得900GB/s的带宽性能，必须用到SXM5的大功率卡，而不是PCIe 5.0的卡，虽然前者的功耗是后者的两倍，达到了可怕的700W，但PCIe 5.0的H100在总体性能和带宽上确实差SXM5一截。

两者在PCIe 5.0上的带宽一致，都是128GB/s，但如果用上NVLink，PCIe 5.0版本的H100只能达到600GB/s的带宽，与第三代NVLink性能一致，只有SXM5版本下的NVLink才能达到满血的900GB/s。

另外在第四代NVLink和第三代NVSwitch技术的组合下，英伟达推出了NVLink Switch这一方案，该系统最多支持到256个GPU，可实现57.6TB/s的总带宽。NVLink Switch也是英伟达DGX H100 SuperPOD系统的关键技术，英伟达甚至把自己收购的Mellanox旗下的InfiniBand节点互联技术拿来对比。从上图可以看出与基于A100+InfiniBand的SuperPOD系统相比，基于H100+NVLink Switch的SuperPOD系统在对分带宽上是前者的9倍。

开放而不是独占

其实NVLink的存在最初让不少人觉得有些一家独大的意思，毕竟最早NVLink仅仅只是用于多个英伟达GPU之间的互联，仅仅只是为自家的产品提供更多优势而已。而去年发布的Grace Hopper Superchip同样用到了这一技术，但这颗芯片却是英伟达设计的Arm CPU和GPU的互联。

这让人不禁担心，如果英伟达真的成功收购了Arm，会不会利用这一优势来全面垄断数据中心和HPC市场。毕竟Arm自己给出的互联方案CMN-700支持的是CCIX 2.0和CXL 2.0这两大标准互联协议，同时为第三方加速器提供PCIe 5.0的连接。但就纸面参数给到的性能看来，NVLink这种专用方案似乎更加吃香一些。

不过Arm作为一家IP公司，目标自然是支持到多样化的加速器，从而全面发展Arm的生态。此前Arm在接受电子发烧友网采访时也表示，Arm期待给市场带来更多的灵活性，支持更多像Grace这样的系统。

好在英伟达似乎也不打算将NVLink-C2C独占，而是宣布开放这一技术，支持集成英伟达技术的芯片半定制，通过Chiplet技术充分利用自家的GPU、DPU、NIC、CPU和SoC产品，与客户的IP进行NVLink-C2C互联。

尽管收购失败，英伟达与Arm的合作并没有就此停止，英伟达也在GTC22上宣布继续与Arm紧密合作，以支持并在未来改进Arm的AMBA CHI协议，加上对CXL的支持，从而与更多加速器和处理器做到互联。

与此同时，在全行业群策群力，试图打通生态的情况下，英伟达也并不打算将NVLink-C2C作为唯一的可选方案。所以除了NVLink-C2C外，集成了英伟达芯片的定制SoC也可选用前段时日公布的UCIe通用Chiplet互联标准，所以不必将数据中心上的CPU、DPU和GPU一整套都换成英伟达旗下的产品，给到第三方服务器芯片、DPU和加速器一个机会。不过，考虑到这两种互联方式只能选其一，英伟达也强调了NVLink-C2C经过优化，拥有更低的延迟、更高的带宽和更高的能效比，该如何选择还是看厂商自己的考量了。

原文标题：900GB/s，NVLink才是英伟达的互联杀手锏

文章出处：【微信公众号：电子发烧友网】欢迎添加关注!文章转载请注明出处。

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

芯片

芯片

+关注

关注
455

文章
50757

浏览量
423356
gpu

gpu

+关注

关注
28

文章
4734

浏览量
128914
显卡

显卡

+关注

关注
16

文章
2432

浏览量
67587
英伟达

英伟达

+关注

关注
22

文章
3772

浏览量
91019

原文标题：900GB/s，NVLink才是英伟达的互联杀手锏

文章出处：【微信号：elecfans，微信公众号：电子发烧友网】欢迎添加关注！文章转载请注明出处。

加速抛弃英伟达，微软又发布一颗芯片 #微软 #英伟达 #半导体 #芯片 #电路知识

英伟达

jf_15747056

发布于 :2024年11月21日 17:31:05

英伟达CEO确认：液冷Grace Blackwell服务器无过热问题

近日，英伟达公司的首席执行官(CEO)针对外界关注的液冷Grace Blackwell服务器过热问题，发表了明确的看法。他强调，采用液冷技术

发表于 11-21 11:45 •273次阅读

英伟达Blackwell可支持10万亿参数模型AI训练，实时大语言模型推理

。英伟达Blackwell是通用计算全栈矩阵的终极解决方案，由多个英伟达芯片组成，包括Blac

发表于 09-04 09:10 •2897次阅读

英伟达回应AI芯片推迟发布传闻

近日，英伟达就外界广泛关注的AI芯片Blackwell推迟发布传闻作出正式回应。8月4日，英伟达

发表于 08-05 17:34 •675次阅读

亚马逊AWS暂缓采购英伟达GH200芯片，期待Blackwell更强

然而，AWS对此予以澄清，称实际上并未取消任何对英伟达的订单。据其代表解释，此次从Grace Hopper芯片转向Blackwell芯片的调

发表于 05-22 15:05 •690次阅读

亚马逊未中断英伟达订单，等待Grace Blackwell更强性能

英国《金融时报》昨日报道称，亚马逊AWS已暂停订购英伟达最新款“超级芯片”Grace Hopper，等待性能更强的新品Grace Black

发表于 05-22 11:00 •465次阅读

英伟达静候新品来临，亚马逊暂缓购买Grace Hopper

今年3月，英伟达发布了全新的Blackwell处理器，距离前任产品Hopper的发布不过短短一年。英伟达

发表于 05-22 09:07 •304次阅读

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

设计，NVIDIA GB200 NVL72 的核心，GB200 Grace Blackwell Superchip，采用 NVIDIA NVLink-C2C 互连

发表于 05-13 17:16

全面解读英伟达NVLink技术

NVLink是一种解决服务器内GPU之间通信限制的协议。与传统的PCIe交换机不同，NVLink带宽有限，可以在服务器内的GPU之间实现高速直接互连。第四代NVLink提供更高的带宽，每条通道达到112Gbps，比PCIe Ge

发表于 04-22 11:01 •1326次阅读

美国首个Grace Hopper架构超算Venado落地：达10 exaFLOPS

该超级计算机是由惠普企业集团（Hewlett Packard Enterprise）打造，其运算能力高达 10 exaFLOPS，它是美国第一款采用英伟达Grace Hopper

发表于 04-18 14:37 •408次阅读

英伟达AI服务器NVLink版与PCIe版有何区别？又如何选择呢？

在人工智能领域，英伟达作为行业领军者，推出了两种主要的GPU版本供AI服务器选择——NVLink版（实为SXM版）与PCIe版。这两者有何本质区别？又该如何根据应用场景做出最佳选择呢？让我们深入探讨一下。

发表于 03-19 11:21 •5513次阅读

全球最小英伟达GH200服务器发布：永擎制造

该服务器搭载英伟达Grace及Hopper人工智能GPU，并通过NVLink实现互联功能以提升整体效能。其中，CPU部分采用72个Arm N

发表于 02-27 15:29 •700次阅读

英伟达智能驾驶的核心芯片——Thor

英伟达原定于 2024 年推出 Atlan，现在雷神（Thor）现已取代Atlan，带来了显著的性能提升，Thor 带来了两杯的性能，推动下一代 GPU 以及新的 Grace Neoverse V

发表于 01-03 14:33 •3403次阅读

英伟达推出为中国大陆定制的H20 AI GPU芯片

尽管英伟达H20降低了AI算力，但其具有更低的售价、支持NVLink高速互联技术以及CUDA等优势。

发表于 01-03 14:30 •1928次阅读

英伟达Grace-Hopper提供一个紧密集成的CPU + GPU解决方案

英伟达Grace-Hopper提供了一个紧密集成的CPU + GPU解决方案，针对生成式人工智能逐渐成为主导的市场环境。

发表于 01-02 15:52 •912次阅读

搜索历史

英伟达发布采用NVLink-C2C技术的Grace Superchip芯片

评论

加速抛弃英伟达，微软又发布一颗芯片 #微软 #英伟达 #半导体 #芯片 #电路知识

英伟达CEO确认：液冷Grace Blackwell服务器无过热问题

英伟达Blackwell可支持10万亿参数模型AI训练，实时大语言模型推理

英伟达回应AI芯片推迟发布传闻

亚马逊AWS暂缓采购英伟达GH200芯片，期待Blackwell更强

亚马逊未中断英伟达订单，等待Grace Blackwell更强性能

英伟达静候新品来临，亚马逊暂缓购买Grace Hopper

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

全面解读英伟达NVLink技术

美国首个Grace Hopper架构超算Venado落地：达10 exaFLOPS

英伟达AI服务器NVLink版与PCIe版有何区别？又如何选择呢？

全球最小英伟达GH200服务器发布：永擎制造

英伟达智能驾驶的核心芯片——Thor

英伟达推出为中国大陆定制的H20 AI GPU芯片

英伟达Grace-Hopper提供一个紧密集成的CPU + GPU解决方案