电子发烧友网报道(文/周凯扬)相信对超算市场有过一定了解的朋友,都对曾经的第一名富岳超算不陌生。这台2021年正式启用的超算,是全球首台登顶TOP500的Arm架构超算。富岳采用了富士通设计A64FX SoC,整个超算集群的峰值性能可以达到537.21PFlop/s。如此强大的性能,甚至于日本东京工业大学、日本东北大学等都宣布将借助富岳来开发日语生成式AI。
然而在最新的TOP500排行榜上,随着更新的英特尔Xeon和AMD EPYC处理器纷纷到位,如今的富岳已经降至第四名的位置。为此,富士通也在开发A64FX的继任者,并计划用于下一代超算的开发中去。
Monaka,A64FX的继任者
作为一直在超算领域发力的头部厂商之一,富士通此前一直选择SPARC作为其计算处理器的架构,直到A64FX的出现。A64FX面世之时一度被称为最强Arm处理器,也让不少人对Arm在数据中心和HPC的前景有了新的改观。
然而这种众核处理器,除非经过特殊的架构优化,否则并不适合用于通用服务器,国产的申威26010服务器也是类似的设计思路。但不可否认在HPC应用下,众核处理器可以发挥出媲美甚至超越传统x86旗舰处理器的实力。
近日,富士通宣布了他们在研的下一代众核Arm处理器Monaka,该处理器除了改用Armv9架构,引入了SVE2之外,还采用了云原生的3D众核设计,专为数据中心做了能效优化。Monaka采用了3D Chiplet的设计方案,其中处理器核心die基于2nm工艺打造,而SRAM和IO die基于5nm工艺打造,通过TSV与核心die相连。
然而在最新的TOP500排行榜上,随着更新的英特尔Xeon和AMD EPYC处理器纷纷到位,如今的富岳已经降至第四名的位置。为此,富士通也在开发A64FX的继任者,并计划用于下一代超算的开发中去。
Monaka,A64FX的继任者
作为一直在超算领域发力的头部厂商之一,富士通此前一直选择SPARC作为其计算处理器的架构,直到A64FX的出现。A64FX面世之时一度被称为最强Arm处理器,也让不少人对Arm在数据中心和HPC的前景有了新的改观。
然而这种众核处理器,除非经过特殊的架构优化,否则并不适合用于通用服务器,国产的申威26010服务器也是类似的设计思路。但不可否认在HPC应用下,众核处理器可以发挥出媲美甚至超越传统x86旗舰处理器的实力。
近日,富士通宣布了他们在研的下一代众核Arm处理器Monaka,该处理器除了改用Armv9架构,引入了SVE2之外,还采用了云原生的3D众核设计,专为数据中心做了能效优化。Monaka采用了3D Chiplet的设计方案,其中处理器核心die基于2nm工艺打造,而SRAM和IO die基于5nm工艺打造,通过TSV与核心die相连。
Monaka 3D众核架构 / 富士通
据富士通透露,2nm的核心die区域仅仅占了整个芯片面积的不到30%,从而带来极高的能效表现,只需用到风冷。同时3D众核架构使其可以塞入双插槽144个核心,实现极低的延迟和更高的带宽。
至于在软件支持上,富士通除了持续开发Linux OS中行业标准软件的支持外,也会参与发展与Arm相关的开源软件生态,加强在Python、Java、LLVM等标准工具上的性能表现。Monaka预计将于2027年正式亮相,考虑到其流片时间,富士通既有可能选择台积电、英特尔等现有的先进晶圆代工厂,也可能考虑正在建设2nm工厂的Rapidus。
HPC转向AI主导?
作为目前最有利可图的市场,AI正在驱动GPGPU聚焦在低精度计算的算力升级上。在CUDA平台的助力下,HPC生态的门槛也在持续降低。从这几年发布的新品来看,无论是FP16、FP8的算力都在成倍增长,然而在FP64这种传统HPC应用需要用到的高精度数据格式上,性能提升却相当有限。
更重要的是,要想通过堆量来提高HPC集群的FP64性能也不再现实了,因为GPU的TDP提升幅度甚至更高。为此,富士通的看法是,将更多的FP64单元放在CPU端,而将更多的HBM和低精度矩阵单元放在GPU端,这样构建HPC系统的客户就不再需要为GPU的巨额成本和巨量功耗买单,却可以利用其在深度学习上的卓越性能。同时,开发更多HPL-MxP应用,利用混合精度计算来提高效率。当然了,也可以施压GPU厂商进一步改善其FP64性能,只不过在生成式AI依旧火热的当下,让GPU厂商放弃这个摇钱树并不现实。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
ARM
+关注
关注
134文章
9020浏览量
366330 -
超算
+关注
关注
1文章
114浏览量
9034 -
富士通
+关注
关注
2文章
190浏览量
54508
发布评论请先 登录
相关推荐
MicroBlaze V软核处理器的功能特性
本指南提供了有关 AMD Vivado Design Suite 中包含的 32 位和 64 位 MicroBlaze V 软核处理器的信息。该文档旨在用作为处理器硬件架构的指南,随附《RISC-V 指令集手册》
ARM处理器的寻址方式
ARM处理器的寻址方式是处理器在执行指令时,根据指令中给出的地址信息来寻找物理地址的方法。ARM处理器支持多种寻址方式,以满足不同的编程需求
ARM处理器和CISC处理器的区别
ARM处理器和CISC(复杂指令集计算机)处理器在多个方面存在显著的区别。这些区别主要体现在架构原理、性能与功耗、设计目标、应用领域以及市场生态等方面。
ARM处理器的结构和特点
ARM处理器,全称Advanced RISC Machines,是一种基于精简指令集(RISC)架构的微处理器。其结构和特点在嵌入式系统、移动设备、物联网等多个领域具有显著优势。以下将
ARM处理器概述和发展历程
ARM处理器是一种基于RISC(精简指令集计算机)架构的高性能微处理器,由英国公司ARM(Advanced RISC Machines)开发
富士通发布2024财年第一季度财报
富士通于昨日发布了2024财年第一季度财报。根据财报显示,2024财年第一季度整体营收为8,300亿日元,较上一年度同期增长3.8%。
实测分享,瑞芯微RK3588八核国产处理器性能测评!确实“遥遥领先”!
ARM Cortex-A76@2.4GHz + 四核ARM Cortex-A55@1.8GHz大小核架构,有国产“至强嵌入式处理器”之称,可
发表于 07-17 10:49
采用144核,能效提升66%!英特尔至强6处理器震撼上市,加速数据中心升级
6能效核处理器基于Intel 3制程工艺,凭借高核心密度及出色的每瓦性能,可在提供高效算力的同时显著降低能源成本。英特尔至强6700E采用144核
英特尔发布至强6能效核处理器
英特尔近日发布了一款革命性的处理器产品——至强6(代号Sierra Forest)。这款处理器以其独特的能效核设计和基于Intel 3制程工艺的技术,在提供卓越
富士通发布《富士通技术与服务愿景2024》
富士通近日发布了《富士通技术与服务愿景2024(Fujitsu Technology and Service Vision 2024,简称FT&SV 2024)》,阐述了对未来商业和社会的愿景。
富士通使用富岳超级计算机训练LLM
尽管富士通的富岳超级计算机不再是超级计算机500强名单中最快的机器,但它仍然是一个非常强大的系统,A64FX处理器的多功能性允许将其用于各种工作负载,例如AI。
实测分享,瑞芯微RK3588八核国产处理器性能测评!确实“遥遥领先”
RK3588处理器优势 RK3588是瑞芯微最新一代旗舰工业处理器,它具有如下卓越优势: 超强运算能力: 四核ARM Cortex-A7
评论