从去年11月公布的最新TOP500超算系统排名上,我们可以看出AMD已经开始蚕食原本属于英特尔的份额,而且速度不容小觑。而英伟达则因为在GPU上的头号交椅地位,成了坚持所有坚持CPU+GPU架构超算的首选。
非但如此,英伟达开始在ARM生态上有所动作,推出了Grace这样的高性能CPU,并被瑞士超算中心的超级计算机系统阿尔卑斯所用。然而近来的一系列动向表明,超算市场并不会就此维持定局。
英特尔:GPU和异构开始猛追
英特尔耕耘了这么多年HPC和超算市场,自然不会白白认输,尤其是自己的图形部门正在崛起的情况下。于是,就在上周的投资者大会上,英特尔公布了全新的HPC-AI超算策略,以CPU+GPU融合在同一个Xeon插槽的设计,由此推出全新的XPU,代号名为FalconShores。
FalconShores将融合通用x86处理器核心和高度并行计算的Xe-HPC GPU核心,并结合英特尔自研的高带宽共享内存。根据英特尔的说法,这种CPU+GPU+通用内存的架构可以将单个插槽的计算密度提升5倍,与现有的设计相比,可将性能功耗比提升5倍以上。
非但如此,英伟达开始在ARM生态上有所动作,推出了Grace这样的高性能CPU,并被瑞士超算中心的超级计算机系统阿尔卑斯所用。然而近来的一系列动向表明,超算市场并不会就此维持定局。
英特尔:GPU和异构开始猛追
英特尔耕耘了这么多年HPC和超算市场,自然不会白白认输,尤其是自己的图形部门正在崛起的情况下。于是,就在上周的投资者大会上,英特尔公布了全新的HPC-AI超算策略,以CPU+GPU融合在同一个Xeon插槽的设计,由此推出全新的XPU,代号名为FalconShores。
FalconShores将融合通用x86处理器核心和高度并行计算的Xe-HPC GPU核心,并结合英特尔自研的高带宽共享内存。根据英特尔的说法,这种CPU+GPU+通用内存的架构可以将单个插槽的计算密度提升5倍,与现有的设计相比,可将性能功耗比提升5倍以上。
![](https://file.elecfans.com/web2/M00/32/39/poYBAGIW4OCAdxBpAAsJICJcUx8467.png)
FalconShoresXPU / 英特尔
这对于英特尔目前的战略来说,基本上可以说是必选的一条技术路线。考虑到英特尔在先进封装技术上并未止步,工艺节点也开始跟上主流代工厂的节奏,异构计算的设计已经在英特尔近期推出的诸多产品中得到了验证,通用内存也已经在业界成了改善延迟提高带宽的常用手段之一。况且英特尔已经在其Sapphire Rapids Xeon服务器处理器上用到了HBM2e这类高带宽内存,FalconShores中自研的高带宽内存会有何等性能确实令人好奇。
FalconShores的另一大优势在与灵活的核心配比,根据工作负载来调整x86核心与Xe核心。英特尔在会上不断给出十万亿亿级的概念,这样的性能在FalconShores的性能下似乎是可行的,不过这一XPU正式进入超算市场的时间不会太快,而是要等到2024年,借助那时的埃米级工艺和Foveros封装技术才能实现。
英伟达:不放弃ARM,也不放弃互联
前阵子英伟达收购ARM失败的消息传来,不少人认为英伟达会就此放弃这块蛋糕,然而英伟达CEO黄仁勋却表示他们并不会就此放弃ARM生态,未来将继续推出Grace这样基于ARM架构的CPU。之所以能有如此的底气,在于英伟达那20年的ARM架构授权。
目前拥有ARM架构授权的企业屈指可数,更不用说64位的授权,并将其用于HPC市场了。英伟达如今这种ARM CPU+GPU的路线,看似是在抢英特尔和AMD的生意,但面向的市场其实又有所不同。
![](https://file.elecfans.com/web2/M00/32/3A/poYBAGIW4POAImMmABUIvibQHDo710.png)
GraceCPU /英伟达
Grace虽然性能不差,但与这些x86 CPU在通用计算上相比还是略逊一筹,况且也不是所有研究机构或超算中心都会像日本一样,构建富岳或紫藤花这种规模的ARM超算。英伟达追求的并不是在通用计算上超过其他两家数十年的积累,而是专注于AI算力。训练自然语言处理模型、利用GPU加速深度学习,这才是英伟达的优势所在。
这时问题来了,为何超算不选择其它通用CPU或其它的GPU产品呢?这样既能兼顾通用计算性能,也能用的GPU的加速性能。这是因为英伟达准备了专用于自家CPU和GPU的互联技术NVLink。过去仅有GPU产品的英伟达仅仅将NVLink技术用于GPU之间的互联,如今在Grace出现后,NVLink4.0可以为GraceCPU和英伟达GPU牵线搭桥。
更不用说英伟达已经在2020年收购了Mellanox,要知道在最新的TOP500超算中,除了使用常规的25/100G以太网互联外,基本都用到了Mellanox的互联技术。英伟达与Mellanox的结合,直接覆盖了三分之二的顶级超算系统。未来的NVLink有了Mellanox的帮忙更是难以匹敌,所以并不是英伟达担心竞品的出现,而是其性能表现之强,让你不得不选择他们旗下的产品。
小结
英特尔在超算上的发力归根结底还是靠XeHPC这样的GPU核心,但作为GPU新秀的英特尔短时间还是无法撼动英伟达在超算上的地位。而英伟达的ARM计划未来如何演进也令人十分期待,毕竟这一产品线不像其消费级GPU,还未有任何路线图公布。但喜人的一点是,超算从百亿亿级过渡到十万亿亿级的过程中,势必会有更多的创新方案出现。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
cpu
+关注
关注
68文章
10922浏览量
213281 -
gpu
+关注
关注
28文章
4795浏览量
129501 -
超算
+关注
关注
1文章
116浏览量
9146
发布评论请先 登录
相关推荐
GPU算力租用平台有什么好处
当今,GPU算力租用平台为科研机构、企业乃至个人开发者提供了灵活高效的算力解决方案。下面,AI部落小编带您深入探讨GPU算力租用平台所带来的
涂鸦将高科技取暖玩出新花样!超级省电更节能,个性化取暖更极致
又到了一年一度的冬季极寒时节,不同于东北普遍供暖、暖气片子能玩出上百种花样的惬意,南方湿冷的空气让南方人再次陷入了靠一身正气取暖的哀嚎时刻。虽然南方还没实现供暖,但近几年靠着国家红利政策的支持
![涂鸦将高科技取暖<b class='flag-5'>玩出新花样</b>!超级省电更节能,个性化取暖更极致](https://file.elecfans.com/web2/M00/40/04/pYYBAGJrTDSAYdI1AAASTiyZjeQ622.jpg)
【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解算力芯片GPU
着色器(Pixel shader)是图形流水线中算力相当强大的功能单元,因为它可以为每个片段执行复杂的计算,从而为最终渲染的图像添加细节和视觉效果。
DirectX API推动 GPU 演进
发表于 11-03 12:55
GPU算力租用平台是什么
GPU算力租用平台是一种基于云计算的服务模式,它允许用户通过互联网按需租用高性能GPU资源,而无需自行购买、部署和维护这些硬件。
【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览
本帖最后由 1653149838.791300 于 2024-10-16 22:19 编辑
感谢平台提供的书籍,厚厚的一本,很有分量,感谢作者的倾力付出成书。
本书主要讲算力芯片CPU
发表于 10-15 22:08
名单公布!【书籍评测活动NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架构分析
这个想法被否决了,因为投入较大、难以落地,且客户对算力的认同远不及今天这种高度。
这几年间其实我们联系甚少,但是作者一直没有脱离对芯片的应用和关注。特别是目睹GPU从消费电子转向算力芯片,目睹
发表于 09-02 10:09
商用清洁赛道,普渡清洁机器人如何玩出新花样?
商用清洁赛道,普渡清洁机器人如何玩出新花样? 前言 每次技术革命,都将对传统模式带来颠覆性改变。 目前,我国产业结构正进入快速升级阶段,智能制造春潮涌动,各行各业正在经历一轮智能化转型升级的变革
算力服务器为什么选择GPU
随着人工智能技术的快速普及,算力需求日益增长。智算中心的服务器作为支撑大规模数据处理和计算的核心设备,其性能优化显得尤为关键。而GPU服务器也进入了大众的视野,成为高性能计算的首选。那么,为什么
![<b class='flag-5'>算</b>力服务器为什么选择<b class='flag-5'>GPU</b>](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
AI服务器异构计算深度解读
AI服务器按芯片类型可分为CPU+GPU、CPU+FPGA、CPU+ASIC等组合形式,CPU+GPU是目前国内的主要选择(占比91.9%)。
发表于 04-12 12:27
•733次阅读
![AI服务器异构计算深度解读](https://file1.elecfans.com/web2/M00/C8/FD/wKgaomYYuMSARvEJAAA1nHv0gHQ129.png)
gpu是什么和cpu的区别
GPU和CPU是两种常见的计算机处理器,它们在结构和功能上有很大的区别。在这篇文章中,我们将探讨GPU和CPU的区别,并详细介绍它们的原理、应用领域和性能特点。 一、概述 1.1
评论