0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大家都在争相超过A100,无人对标的Grace Hopper性能几何?

E4Life 来源:电子发烧友网 作者:周凯扬 2023-09-06 01:10 次阅读

电子发烧友网报道(文/周凯扬)作为英伟达CPUGPU技术开发上的集大成之作,Grace Hopper很大程度上象征着复杂计算领军产品。尽管英伟达竭尽所能地去堆这一“超级芯片”的性能,但英伟达还是选择将Grace Hopper(GH200)描述成了世界上最万能的计算平台,这也得益于它同时在AI计算和HPC计算领域展现的可怕性能。

AI计算性能

相信绝大多数人已经从市场疯抢A100、H100的现状,对Hopper GPU(H100)的性能有了大致的了解,但Grace Hopper作为一个异构计算平台,在与传统的x86 CPU与H100对比上,也有着不小的性能差距。

首要区别自然就是连接Grace CPU和Hopper GPU的NVLink-C2C,这一高带宽低延迟的互联技术可谓是目前唯一能发挥H100近乎全部实力的方案。支持最高144TB内存的同时,提供900GB/s的带宽。

英伟达官方也对部分AI计算负载进行了测试,在终端应用上对比x86+Hopper与Grace Hopper的一体化方案有何异同。其性能差距可以说是巨大的,就拿最常见的大语言模型推理来说,GH200可以做到x86平台的4.5倍性能表现,而DLRM(深度学习推荐模型)训练与图神经网络(GNN)训练的性能也可以分别达到3.5倍和1.9倍。

其实这里的差异还是体现在互联方案的带宽上,例如x86+Hopper的方案还是在使用PCIe方案,该方案在batch size较小时性能落后还不算明显,一旦到了更大的batch size,PCIe的带宽就成了瓶颈,而不断以高带宽输送数据给H100的NVLink-C2C则可以实现比PCIe高出数倍的性能。

HPC计算性能

Grace Hopper的另一大应用领域自然就是HPC了。HPC主要集中在一些科学、工程的复杂计算上,比如天气预测、生命科学、流体力学等。然而与此同时,不少商业相关的HPC计算也在进一步推动HPC的发展,甚至更早用上最新芯片技术,比如油藏模拟等。

著名油藏模拟软件ECHELON的开发商Stone Ridge,在最近获得了早期访问权,对英伟达的H100-PCIe、H100-NVL和Grace-Hopper来了场性能测试。早在Volta和Ampere架构时,Stone Ridge就对不同架构的GPU进行了测试,而如今的H100相较这些旧GPU已经在CUDA核心、内存容量和内存带宽上有了数倍的提升。

这些还只是表面上的变化,英伟达还引入了诸多架构改进,提高了ML和HPC应用程序的性能。而Grace Hopper相较传统的x86+GPU方案就更具优势了,首先Grace本身就是一个强大的CPU,每个内核都有四个128位适量单元,超高的内存带宽以及超大的L2+L3缓存。其次,NVLink的存在大大减少了CPU和GPU之间的通信时间。

wKgaomT2_uKAdLA8AAFQ5Yki0Qg725.png
不同架构不同版本的英伟达GPU在ECHELON模型上的性能对比 / Stone Ridge


Stone Ridge选择了不同细胞规模的模型,从83000个细胞到670万个细胞,其中Grace Hopper都展现出了不俗的性能,最高可达Volta架构的V100的5.7倍。值得一提的是,由于CPU采用了新的Arm架构,所以ECHELON必须重新编译才能在系统上运行,不过对于ECHELON来说,重新编译并不要花太多力气,他们在不修改代码的情况就成功重编译在GH200上正常运行。如果对代码进行进一步优化的话,还有机会获得更高的性能表现。如此高的性能提升,意味着油藏勘探模拟的时间可以被大幅缩短,从而加快油藏评估的速度。

结语

可以说无论是A100还是H100,都只是英伟达在AI与HPC战线扩大战果的第一步棋,明年Q2交付到各大系统中的GH200才是最大的杀手锏,也很可能会成为更抢手的数据中心与超算中心硬件产品。这也恰好证明了英伟达给它的定位,世界上最万能的计算平台。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏

    评论

    相关推荐

    英伟达v100A100的差距有哪些?

    英伟达v100A100的差距有哪些? 在当今人工智能和深度学习技术日益发展的时代,高性能计算机显卡已成为支持这些技术发展的关键。英伟达是高性能计算机显卡领域的领导者之一,其v
    的头像 发表于 08-22 16:46 1.8w次阅读

    gh200和a100的区别

    gh200和a100的区别 GH200和A100是两款不同的移动通讯设备,GH200是一款手机,而A100是一款平板电脑。虽然这两款设备的形态有很大的不同,但是它们在很多方面都有着相似的特点,比如
    的头像 发表于 08-16 17:34 668次阅读

    英伟达a100和h100哪个强?英伟达A100和H100的区别

    英伟达a100和h100哪个强? 就A100和H100这两个产品来说,它们虽然都是英伟达公司的高性能计算产品,但是面向的市场和应用场景不同,
    的头像 发表于 08-09 17:31 4.2w次阅读

    英伟达h800和a100的区别

    A100处理器比H800处理器更多,因此更强大。 3. CUDA核心:H800每个处理器有5120个CUDA核心,A100每个处理器有6912个CUDA核心。A100具有比H800更多的CUDA核心,因此具有更高的计算
    的头像 发表于 08-08 16:05 1.5w次阅读
    英伟达h800和<b class='flag-5'>a100</b>的区别

    英伟达h800和a100参数对比

    性能上更加出色。 4.极限功耗: H800的TDP为300W,而A100的TDP为400W,A100更加耗电。 5.显存: H800拥有16GB HBM2显存,而A100拥有40GB
    的头像 发表于 08-08 15:53 2.7w次阅读
    英伟达h800和<b class='flag-5'>a100</b>参数对比

    英伟达a100有国产替代吗?

    和昇腾920芯片均具有AI处理能力。另外,国内企业紫光展锐、寒武纪等也在不断推出性能与英伟达A100相近的AI芯片。虽然目前这些芯片还无法完全替代英伟达A100,但随着技术的不断进步和发展,未来会有越来越多的国产芯片可以拥有与
    的头像 发表于 08-08 15:37 3960次阅读

    英伟达A100的算力是多少?

    19.5 TFLOPS的FP32浮点性能和156 TFLOPS的深度学习性能。 英伟达a100显卡采用了7nm制程工艺+Ampere架构; 英伟达a100拥有540亿个晶体管,
    的头像 发表于 08-08 15:28 2.9w次阅读

    英伟达A100的优势分析

    HBM2显存。 英伟达A100是一款高性能的GPU,其主要优势如下: 1. 支持高效的AI计算:A100采用了新一代的Tensor Core技术,能够在AI计算方面提供卓越的性能,为A
    的头像 发表于 08-08 15:25 2929次阅读

    英伟达A100的简介

    英伟达A100的简介 A100都是非常强大的GPU。英伟达A100A800、H100、V100
    的头像 发表于 08-08 15:17 8147次阅读

    英伟达A100是什么系列?

    英伟达A100是什么系列? 全球都在关注生成式人工智能;特别是OpenAI发布ChatGPT以来,生成式人工智能技术一下就被拔高。在大模型训练中,A100是非常强大的GPU。英伟达的AI芯片这个时候
    的头像 发表于 08-08 15:13 2659次阅读

    英伟达A100A40的对比

    TFLOPS的FP32浮点性能和156 TFLOPS的深度学习性能。 英伟达A100A40是英伟达公司推出的两个数据中心加速器。它们都是基于英伟达的Ampere架构设计的最新GPU
    的头像 发表于 08-08 15:08 1.5w次阅读

    英伟达A100和4090的区别

    英伟达A100和4090的区别 英伟达A100和4090都是英伟达的高性能计算卡型号。它们之间的主要区别在于: 1. 架构:英伟达A100采用的是Ampere架构,而4090采用的是V
    的头像 发表于 08-08 11:59 2.8w次阅读

    英伟达A100和H100的区别

    英伟达A100和H100的区别 英伟达A100和H100是两种不同的产品。A100是英伟达在2020年推出的一款基于Ampere架构的数据中
    的头像 发表于 08-07 18:06 2.7w次阅读

    英伟达a100a800的区别

    的浮点性能为19.5 TFLOPS,而A800为10.6 TFLOPS。 3. 存储容量不同:A100的显存最大为80 GB,而A800为48 GB。 4. AI加速器不同:
    的头像 发表于 08-07 17:57 3.7w次阅读

    英伟达a100和h100哪个强?

    英伟达a100和h100哪个强? 英伟达A100比H100更强。英伟达A100在处理大型模型和数据集时可能比V
    的头像 发表于 08-07 17:32 1.3w次阅读