大家都在争相超过A100，无人对标的Grace Hopper性能几何？-电子发烧友网

电子发烧友网报道（文/周凯扬）作为英伟达在CPU与GPU技术开发上的集大成之作，Grace Hopper很大程度上象征着复杂计算领军产品。尽管英伟达竭尽所能地去堆这一“超级芯片”的性能，但英伟达还是选择将Grace Hopper（GH200）描述成了世界上最万能的计算平台，这也得益于它同时在AI计算和HPC计算领域展现的可怕性能。

AI计算性能

相信绝大多数人已经从市场疯抢A100、H100的现状，对Hopper GPU（H100）的性能有了大致的了解，但Grace Hopper作为一个异构计算平台，在与传统的x86 CPU与H100对比上，也有着不小的性能差距。

首要区别自然就是连接Grace CPU和Hopper GPU的NVLink-C2C，这一高带宽低延迟的互联技术可谓是目前唯一能发挥H100近乎全部实力的方案。支持最高144TB内存的同时，提供900GB/s的带宽。

英伟达官方也对部分AI计算负载进行了测试，在终端应用上对比x86+Hopper与Grace Hopper的一体化方案有何异同。其性能差距可以说是巨大的，就拿最常见的大语言模型推理来说，GH200可以做到x86平台的4.5倍性能表现，而DLRM（深度学习推荐模型）训练与图神经网络（GNN）训练的性能也可以分别达到3.5倍和1.9倍。

其实这里的差异还是体现在互联方案的带宽上，例如x86+Hopper的方案还是在使用PCIe方案，该方案在batch size较小时性能落后还不算明显，一旦到了更大的batch size，PCIe的带宽就成了瓶颈，而不断以高带宽输送数据给H100的NVLink-C2C则可以实现比PCIe高出数倍的性能。

HPC计算性能

Grace Hopper的另一大应用领域自然就是HPC了。HPC主要集中在一些科学、工程的复杂计算上，比如天气预测、生命科学、流体力学等。然而与此同时，不少商业相关的HPC计算也在进一步推动HPC的发展，甚至更早用上最新的芯片技术，比如油藏模拟等。

著名油藏模拟软件ECHELON的开发商Stone Ridge，在最近获得了早期访问权，对英伟达的H100-PCIe、H100-NVL和Grace-Hopper来了场性能测试。早在Volta和Ampere架构时，Stone Ridge就对不同架构的GPU进行了测试，而如今的H100相较这些旧GPU已经在CUDA核心、内存容量和内存带宽上有了数倍的提升。

这些还只是表面上的变化，英伟达还引入了诸多架构改进，提高了ML和HPC应用程序的性能。而Grace Hopper相较传统的x86+GPU方案就更具优势了，首先Grace本身就是一个强大的CPU，每个内核都有四个128位适量单元，超高的内存带宽以及超大的L2+L3缓存。其次，NVLink的存在大大减少了CPU和GPU之间的通信时间。

不同架构不同版本的英伟达GPU在ECHELON模型上的性能对比 / Stone Ridge

Stone Ridge选择了不同细胞规模的模型，从83000个细胞到670万个细胞，其中Grace Hopper都展现出了不俗的性能，最高可达Volta架构的V100的5.7倍。值得一提的是，由于CPU采用了新的Arm架构，所以ECHELON必须重新编译才能在系统上运行，不过对于ECHELON来说，重新编译并不要花太多力气，他们在不修改代码的情况就成功重编译在GH200上正常运行。如果对代码进行进一步优化的话，还有机会获得更高的性能表现。如此高的性能提升，意味着油藏勘探模拟的时间可以被大幅缩短，从而加快油藏评估的速度。

结语

可以说无论是A100还是H100，都只是英伟达在AI与HPC战线扩大战果的第一步棋，明年Q2交付到各大系统中的GH200才是最大的杀手锏，也很可能会成为更抢手的数据中心与超算中心硬件产品。这也恰好证明了英伟达给它的定位，世界上最万能的计算平台。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

小轴距高性能！时代星光发布蜂鹰F1超高性价比单兵无人机

随着无人机产业的发展，无人机在各个行业、各个领域的应用都在不断深化。近日，时代星光科技发布了全新自研的高性能单兵无人机蜂鹰F1，以轻巧便携、

发表于 12-24 15:01 •170次阅读

小轴距高<b class='flag-5'>性能</b>！时代星光发布蜂鹰F1超高性价比单兵<b class='flag-5'>无人</b>机

英伟达CEO确认：液冷Grace Blackwell服务器无过热问题

问题”。这一表态无疑为市场注入了一剂强心针。随着数据中心运算需求的不断增长，服务器的散热问题日益凸显，成为制约其性能发挥的关键因素之一。而英伟达作为全球领先的图形处理器(GPU)制造商，其服务器产品的散热性能自然备受瞩目。据悉，Gr

发表于 11-21 11:45 •292次阅读

本期为大家带来的是100W氮化镓充电器详细介绍拆解。

本期为大家带来的是100W氮化镓充电器详细介绍拆解。这款充电器配备折叠插脚以及2C1A接口，两个USB-C口均支持100W PD快充和PPS快充，USB-

发表于 11-11 14:59 •796次阅读

软银升级人工智能计算平台,安装4000颗英伟达Hopper GPU

达Ampere GPU。通过新增的4000颗Hopper GPU，该平台的总计算性能已跃升至每秒约4.7百亿亿次。

发表于 11-04 16:18 •459次阅读

英伟达或取消B100转用B200A代替

今年3月份，英伟达在美国加利福尼亚州圣何塞会议中心召开的GTC 2024大会上推出了Blackwell架构GPU。原定于今年底出货的B100/B200被寄予厚望，将替代现行H100/H200，并有与Grace CPU协作的GB2

发表于 08-08 17:19 •554次阅读

NVIDIA AI Enterprise荣获金奖

NVIDIA AI Enterprise、GH200 Grace Hopper 超级芯片和 Spectrum-X 在 COMPUTEX 2024 获得认可。

发表于 05-29 09:27 •469次阅读

亚马逊AWS暂缓订购英伟达Grace Hopper，等待新品Grace Blackwel

今年 3 月，英伟达宣布了新款人工智能处理器Blackwell，比上一代Hopper提前不到一年面世。CEO黄仁勋表示，新产品在训练大规模语言模型方面的性能将提升一倍。

发表于 05-22 12:03 •665次阅读

亚马逊未中断英伟达订单，等待Grace Blackwell更强性能

英国《金融时报》昨日报道称，亚马逊AWS已暂停订购英伟达最新款“超级芯片”Grace Hopper，等待性能更强的新品Grace Blackwell（GH200）。此举引发市场担忧，认

发表于 05-22 11:00 •496次阅读

英伟达静候新品来临，亚马逊暂缓购买Grace Hopper

今年3月，英伟达发布了全新的Blackwell处理器，距离前任产品Hopper的发布不过短短一年。英伟达首席执行官黄仁勋表示，新款产品在训练大规模语言模型上的效率将提升至原来的两倍。

发表于 05-22 09:07 •319次阅读

NVIDIA Grace Hopper点亮AI超级计算新时代

瑞士 Alps、法国 EXA1-HE 等超级计算机将使用高能效的、基于 Grace 的系统为气候和天气、科学探索等领域提供 200 EFLOPS AI 算力，以支持突破性研究。

发表于 05-15 09:46 •392次阅读

NVIDIA通过CUDA-Q平台为全球各地的量子计算中心提供加速

德国、日本和波兰的超级计算机利用 Grace-Hopper 和量子-经典加速超算平台推进量子计算研究。

发表于 05-14 09:15 •377次阅读

美国首个Grace Hopper架构超算Venado落地：达10 exaFLOPS

该超级计算机是由惠普企业集团（Hewlett Packard Enterprise）打造，其运算能力高达 10 exaFLOPS，它是美国第一款采用英伟达Grace Hopper芯片架构的超级计算机系统。

发表于 04-18 14:37 •434次阅读

英伟达H200和A100的区别

英伟达H200和A100两款芯片在性能、架构、内存以及应用场景等多个方面存在显著的区别。

发表于 03-07 16:23 •3743次阅读

英伟达H200和A100的差异

英伟达H200和A100在多个方面存在差异。

发表于 03-07 16:18 •2637次阅读

Arm架构与Neoverse技术在基础设施领域的应用与发展

Arm的Neoverse系列已有稳定的立足点。例如，英伟达的超级芯片Grace-Hopper就是由两片独立的芯片组成，其中 Hopper负责处理所有AI任务，如张量运算，Grace则扮演 CPU角色，利用I/O与内存管理功能与常

发表于 02-22 15:36 •610次阅读

搜索历史

大家都在争相超过A100，无人对标的Grace Hopper性能几何？

评论

小轴距高性能！时代星光发布蜂鹰F1超高性价比单兵无人机

英伟达CEO确认：液冷Grace Blackwell服务器无过热问题

本期为大家带来的是100W氮化镓充电器详细介绍拆解。

软银升级人工智能计算平台,安装4000颗英伟达Hopper GPU

英伟达或取消B100转用B200A代替

NVIDIA AI Enterprise荣获金奖

亚马逊AWS暂缓订购英伟达Grace Hopper，等待新品Grace Blackwel

亚马逊未中断英伟达订单，等待Grace Blackwell更强性能

英伟达静候新品来临，亚马逊暂缓购买Grace Hopper

NVIDIA Grace Hopper点亮AI超级计算新时代

NVIDIA通过CUDA-Q平台为全球各地的量子计算中心提供加速

美国首个Grace Hopper架构超算Venado落地：达10 exaFLOPS

英伟达H200和A100的区别

英伟达H200和A100的差异

Arm架构与Neoverse技术在基础设施领域的应用与发展