英伟达超级芯片的真正杀手锏，C2C互联技术-电子发烧友网

电子发烧友网报道（文/周凯扬）英伟达于今年发布了新一代的GH200 Grace Hopper硬件平台，预示着其发展HPC与AI的重要路线迈进了新阶段。GH200将用于应对世界上最复杂的生成式AI负载，涵盖大语言模型、推荐系统和矢量数据库等应用，且英伟达依然为GH200准备了不同的配置选项，无疑这一芯片很快就会用于各大数据中心和超算中。

NVLink，从片外互联走向片内互联

或许在多数人眼中，GH200不过是新一代Grace CPU和Hopper GPU结合的又一新产品，但这必然不是英伟达追求的“1+1=2”效果。事实上，GH200是象征着英伟达在芯片互联技术先进设计水平的集大成者。

在英伟达的第四代NVLink技术和第三代NVSwitch技术下，创造一个256个GH200连接在一起的系统也不在话下。但这样的片外互联技术并不算罕见，市面上也有不少初创公司的AI芯片可以做到类似或者更夸张的扩展性。

然而在片内芯片互联上，NVLink-C2C这一互联技术确实达到了新的高度。NVLink-C2C是英伟达专为其superchip系列打造的内存一致、高带宽、低延迟互联技术。也是其实现高达900GB/s总带宽的关键所在。900GB/s的带宽是什么概念呢？与现代AI/HPC加速器常用的16路的PCIe 5.0相比，还要快上6倍。

NVLink-C2C的优势

NVLink-C2C的第一大优势就是其内存一致性，这不仅提高了开发者的效率、芯片性能，还提高了GPU可以访问的内存量。在这一互联技术的支持下，如今CPU、GPU线程都可以并行访问CPU和GPU各自的内存，无需页迁移，所以开发者可以专心于优化算法本身，而不是内存管理。

其次就是900GB/s的带宽了，有了NVLink-C2C，应用程序可以直接用满GPU的内存，再以超高的带宽直接调用Grace CPU的内存。毕竟即便是最新的HBM3e版GH200，也只有144GB的内存，而Grace CPU可以支持到最高480GB的LPDDR5X内存。甚至在NVSwitch的支持下，可以高速访问整个系统中最高达144TB的内存。

如此一来在GPT这样的LLM模型中，可用的内存也就变多了。这对于batch size增加后，推理所需内存数增加的生成式AI来说至关重要。相比过去x86 CPU+PCIe 5.0 H100的搭配组合，GH200在更大的batch size下推理速度有着数倍的提升。

英伟达也对高带宽在HPC加速上的优势进行了解读，以ABINIT的标准执行时间为例，ABINIT是一个用于计算材料光学、机械、振动等特性的模拟软件。以只用x86 CPU的执行时间作为标准，在x86 CPU与Hopper GPU的结合下，超高性能的Hopper GPU极大地缩短了执行时间。

然而在CPU与GPU之间的传输开销下，这一组合最终只能做到快上1.16倍的优势。而如果是使用Grace Hopper方案的话，在NVLink-C2C的超大带宽下，CPU与GPU之间的传输开销迅速缩减，最终实现了缩短4.25倍的执行时间。

写在最后

英伟达会走上自研CPU和Superchip的路线其实并不令人意外，为CPU与GPU之间打通一个更快的接口一直是英伟达的努力方向之一。此前由于x86的CPU设计主要还是有英特尔和AMD两家厂商完成，而Grace这样的自研Arm芯片则没了设计限制，可以掺入英伟达的各种定制化开发。

NVLink-C2C也为市面上其他的AI芯片带来了更大的挑战，毕竟英伟达在性能、软件生态上已经处于领先地位，又有着如此高效的互联技术。可以预见未来其他厂商也会在芯片互联、高速接口等领域发力，否则很难与英伟达同台竞争。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英伟达

英伟达

+关注

关注
22

文章
3773

浏览量
91029

加速抛弃英伟达，微软又发布一颗芯片 #微软 #英伟达 #半导体 #芯片 #电路知识

英伟达

jf_15747056

发布于 :2024年11月21日 17:31:05

英伟达Blackwell芯片量产加速,Q4预计出货达45万片

摩根士丹利最新发布的报告揭示了英伟达在AI芯片领域的重大进展，其最新力作Blackwell芯片已成功步入量产阶段，预示着英伟

发表于 09-27 15:02 •869次阅读

英伟达TITAN AI显卡曝光，性能狂超RTX 4090达63%！# 英伟达# 显卡

显卡英伟达

jf_02331860

发布于 :2024年07月24日 17:18:28

英伟达带领芯片股飙升英伟达大涨4.76%

英伟达不愧是总龙头，大涨4.76%。英伟达带领芯片股飙升；甚至可以说是带动了美国股市上涨，在当地时间22日，科技股反弹，带动整体行情走高。美

发表于 07-23 16:26 •331次阅读

亚马逊AWS暂缓采购英伟达GH200芯片，期待Blackwell更强

然而，AWS对此予以澄清，称实际上并未取消任何对英伟达的订单。据其代表解释，此次从Grace Hopper芯片转向Blackwell芯片的调整仅限于AWS与

发表于 05-22 15:05 •690次阅读

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

新的标准。Blackwell架构和GB200 超级芯片有望推动英伟达在人工智能领域更进一步，巩固其在高性能计算和人工智能技术领域的领先地位。

发表于 05-13 17:16

英伟达帮助日本建造混合量子超级计算机

英伟达正在帮助日本建造混合量子超级计算机，这是日本国家量子计算计划的一部分。

发表于 04-23 14:54 •539次阅读

Meta将率先使用英伟达最新人工智能芯片

近日，Meta向外媒透露，他们预计将在今年晚些时候收到英伟达最新旗舰人工智能芯片的首批出货，这也标志着英伟达正式开启了B200

发表于 03-22 10:16 •558次阅读

新思科技携手英伟达：基于加速计算、生成式AI和Omniverse释放下一代EDA潜能

将双方数十年的合作深入扩展到新思科技EDA全套技术栈摘要：新思科技携手英伟达，将其领先的AI驱动型电子设计自动化（EDA）全套技术栈部署于英伟

发表于 03-20 13:43 •274次阅读

英伟达市值逼近2万亿美元，涨疯了

22日，美国芯片巨头英伟达股价飙升，市值接近2万亿美元，仅次于微软和苹果。英伟达的骄人业绩及股价

发表于 03-05 08:25 •339次阅读

英伟达收涨16.4% 分析师称英伟达股价可能达到四位数

英伟达收涨16.4% 分析师称英伟达股价可能达到四位数就在英伟达发布了拯救地球任务的业绩报告之

发表于 02-23 15:35 •840次阅读

英伟达与Equinix合作为企业客户提供超级计算机系统

近日，数据中心运营商Equinix与芯片巨头英伟达宣布达成一项重要合作。双方将共同为企业客户提供英伟达的

发表于 01-29 11:20 •733次阅读

英伟达DRIVE Thor超级芯片首搭极氪新车

英伟达和极氪汽车宣布了一项令人振奋的合作，新款极氪电动汽车将全球首发搭载英伟达DRIVE Thor超级芯

发表于 01-25 17:25 •1315次阅读

英伟达与中国市场的博弈英伟达特供芯片遇冷

英伟达在面临美国新规的挑战时，迅速为中国市场开发了特供版AI芯片，旨在满足中国对尖端人工智能技术的需求。

发表于 01-08 17:07 •1170次阅读

英伟达斥资预购HBM3内存，为H200及超级芯片储备产能

据最新传闻，英伟达正在筹划发布两款搭载HBM3E内存的新品——包括141GB HBM3E的H200 GPU及GH200超级芯片，这也进一步说明了对于HBM内存的大量需求。

发表于 01-02 09:27 •776次阅读

搜索历史

英伟达超级芯片的真正杀手锏，C2C互联技术

评论

加速抛弃英伟达，微软又发布一颗芯片 #微软 #英伟达 #半导体 #芯片 #电路知识

英伟达Blackwell芯片量产加速,Q4预计出货达45万片

英伟达TITAN AI显卡曝光，性能狂超RTX 4090达63%！# 英伟达# 显卡

英伟达带领芯片股飙升英伟达大涨4.76%

亚马逊AWS暂缓采购英伟达GH200芯片，期待Blackwell更强

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

英伟达帮助日本建造混合量子超级计算机

Meta将率先使用英伟达最新人工智能芯片

新思科技携手英伟达：基于加速计算、生成式AI和Omniverse释放下一代EDA潜能

英伟达市值逼近2万亿美元，涨疯了

英伟达收涨16.4% 分析师称英伟达股价可能达到四位数

英伟达与Equinix合作为企业客户提供超级计算机系统

英伟达DRIVE Thor超级芯片首搭极氪新车

英伟达与中国市场的博弈英伟达特供芯片遇冷

英伟达斥资预购HBM3内存，为H200及超级芯片储备产能