0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

预定下代超算第一?富士通144核Arm处理器公开

E4Life 来源:电子发烧友网 作者:周凯扬 2024-06-24 00:26 次阅读
电子发烧友网报道(文/周凯扬)相信对超算市场有过一定了解的朋友,都对曾经的第一名富岳超算不陌生。这台2021年正式启用的超算,是全球首台登顶TOP500的Arm架构超算。富岳采用了富士通设计A64FX SoC,整个超算集群的峰值性能可以达到537.21PFlop/s。如此强大的性能,甚至于日本东京工业大学、日本东北大学等都宣布将借助富岳来开发日语生成式AI

然而在最新的TOP500排行榜上,随着更新的英特尔Xeon和AMD EPYC处理器纷纷到位,如今的富岳已经降至第四名的位置。为此,富士通也在开发A64FX的继任者,并计划用于下一代超算的开发中去。

Monaka,A64FX的继任者

作为一直在超算领域发力的头部厂商之一,富士通此前一直选择SPARC作为其计算处理器的架构,直到A64FX的出现。A64FX面世之时一度被称为最强Arm处理器,也让不少人对Arm在数据中心和HPC的前景有了新的改观。

然而这种众核处理器,除非经过特殊的架构优化,否则并不适合用于通用服务器,国产的申威26010服务器也是类似的设计思路。但不可否认在HPC应用下,众核处理器可以发挥出媲美甚至超越传统x86旗舰处理器的实力。

近日,富士通宣布了他们在研的下一代众核Arm处理器Monaka,该处理器除了改用Armv9架构,引入了SVE2之外,还采用了云原生的3D众核设计,专为数据中心做了能效优化。Monaka采用了3D Chiplet的设计方案,其中处理器核心die基于2nm工艺打造,而SRAM和IO die基于5nm工艺打造,通过TSV与核心die相连。
Monaka 3D众核架构 / 富士通

据富士通透露,2nm的核心die区域仅仅占了整个芯片面积的不到30%,从而带来极高的能效表现,只需用到风冷。同时3D众核架构使其可以塞入双插槽144个核心,实现极低的延迟和更高的带宽。

至于在软件支持上,富士通除了持续开发Linux OS中行业标准软件的支持外,也会参与发展与Arm相关的开源软件生态,加强在PythonJava、LLVM等标准工具上的性能表现。Monaka预计将于2027年正式亮相,考虑到其流片时间,富士通既有可能选择台积电、英特尔等现有的先进晶圆代工厂,也可能考虑正在建设2nm工厂的Rapidus。

HPC转向AI主导?

作为目前最有利可图的市场,AI正在驱动GPGPU聚焦在低精度计算的算力升级上。在CUDA平台的助力下,HPC生态的门槛也在持续降低。从这几年发布的新品来看,无论是FP16、FP8的算力都在成倍增长,然而在FP64这种传统HPC应用需要用到的高精度数据格式上,性能提升却相当有限。

更重要的是,要想通过堆量来提高HPC集群的FP64性能也不再现实了,因为GPU的TDP提升幅度甚至更高。为此,富士通的看法是,将更多的FP64单元放在CPU端,而将更多的HBM和低精度矩阵单元放在GPU端,这样构建HPC系统的客户就不再需要为GPU的巨额成本和巨量功耗买单,却可以利用其在深度学习上的卓越性能。同时,开发更多HPL-MxP应用,利用混合精度计算来提高效率。当然了,也可以施压GPU厂商进一步改善其FP64性能,只不过在生成式AI依旧火热的当下,让GPU厂商放弃这个摇钱树并不现实。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9020

    浏览量

    366330
  • 超算
    +关注

    关注

    1

    文章

    114

    浏览量

    9034
  • 富士通
    +关注

    关注

    2

    文章

    190

    浏览量

    54508
收藏 人收藏

    评论

    相关推荐

    MicroBlaze V软处理器的功能特性

    本指南提供了有关 AMD Vivado Design Suite 中包含的 32 位和 64 位 MicroBlaze V 软处理器的信息。该文档旨在用作为处理器硬件架构的指南,随附《RISC-V 指令集手册》
    的头像 发表于 10-16 09:17 317次阅读
    MicroBlaze V软<b class='flag-5'>核</b><b class='flag-5'>处理器</b>的功能特性

    ARM处理器的寻址方式

    ARM处理器的寻址方式是处理器在执行指令时,根据指令中给出的地址信息来寻找物理地址的方法。ARM处理器支持多种寻址方式,以满足不同的编程需求
    的头像 发表于 10-05 17:08 164次阅读

    ARM处理器和CPU有什么区别

    ARM处理器和CPU(中央处理器)之间的关系及区别,可以从多个维度进行深入探讨。首先,需要明确的是,ARM处理器并非
    的头像 发表于 09-10 11:24 773次阅读

    ARM处理器的寄存组织及功能

    ARM处理器的寄存组织是其核心架构的重要组成部分,对于理解ARM处理器的运行机制和性能特点具有重要意义。以下是对
    的头像 发表于 09-10 11:11 783次阅读

    ARM处理器和CISC处理器的区别

    ARM处理器和CISC(复杂指令集计算机)处理器在多个方面存在显著的区别。这些区别主要体现在架构原理、性能与功耗、设计目标、应用领域以及市场生态等方面。
    的头像 发表于 09-10 11:10 299次阅读

    ARM处理器的结构和特点

    ARM处理器,全称Advanced RISC Machines,是种基于精简指令集(RISC)架构的微处理器。其结构和特点在嵌入式系统、移动设备、物联网等多个领域具有显著优势。以下将
    的头像 发表于 09-10 11:09 450次阅读

    ARM处理器概述和发展历程

    ARM处理器种基于RISC(精简指令集计算机)架构的高性能微处理器,由英国公司ARM(Advanced RISC Machines)开发
    的头像 发表于 09-10 11:07 429次阅读

    富士通发布2024财年第一季度财报

    富士通于昨日发布了2024财年第一季度财报。根据财报显示,2024财年第一季度整体营收为8,300亿日元,较上年度同期增长3.8%。
    的头像 发表于 07-26 17:22 725次阅读

    实测分享,瑞芯微RK3588八国产处理器性能测评!确实“遥遥领先”!

    ARM Cortex-A76@2.4GHz + 四ARM Cortex-A55@1.8GHz大小架构,有国产“至强嵌入式处理器”之称,可
    发表于 07-17 10:49

    采用144,能效提升66%!英特尔至强6处理器震撼上市,加速数据中心升级

    6能效处理器基于Intel 3制程工艺,凭借高核心密度及出色的每瓦性能,可在提供高效力的同时显著降低能源成本。英特尔至强6700E采用144
    的头像 发表于 06-11 18:13 6583次阅读
    采用<b class='flag-5'>144</b><b class='flag-5'>核</b>,能效提升66%!英特尔至强6<b class='flag-5'>处理器</b>震撼上市,加速数据中心升级

    英特尔发布至强6能效处理器

    英特尔近日发布了款革命性的处理器产品——至强6(代号Sierra Forest)。这款处理器以其独特的能效设计和基于Intel 3制程工艺的技术,在提供卓越
    的头像 发表于 06-07 15:55 508次阅读

    富士通发布《富士通技术与服务愿景2024》

    富士通近日发布了《富士通技术与服务愿景2024(Fujitsu Technology and Service Vision 2024,简称FT&SV 2024)》,阐述了对未来商业和社会的愿景。
    的头像 发表于 05-29 17:07 444次阅读
    <b class='flag-5'>富士通</b>发布《<b class='flag-5'>富士通</b>技术与服务愿景2024》

    富士通使用富岳超级计算机训练LLM

    尽管富士通的富岳超级计算机不再是超级计算机500强名单中最快的机器,但它仍然是个非常强大的系统,A64FX处理器的多功能性允许将其用于各种工作负载,例如AI。
    的头像 发表于 05-13 14:18 487次阅读

    实测分享,瑞芯微RK3588八国产处理器性能测评!确实“遥遥领先”

    RK3588处理器优势 RK3588是瑞芯微最新代旗舰工业处理器,它具有如下卓越优势:   超强运算能力: 四ARM Cortex-A7
    的头像 发表于 01-29 14:03 1.2w次阅读
    实测分享,瑞芯微RK3588八<b class='flag-5'>核</b>国产<b class='flag-5'>处理器</b>性能测评!确实“遥遥领先”

    国产ARM建设历程 Arm计算在领域的实践

    ARM 指令集兼容架构已成为HPC 主流技术与未来发展的重要趋势,可满足大型系统与商用HPC 系统的技术需求。
    的头像 发表于 01-25 14:06 1167次阅读
    国产<b class='flag-5'>ARM</b><b class='flag-5'>超</b><b class='flag-5'>算</b>建设历程 <b class='flag-5'>Arm</b>计算在<b class='flag-5'>超</b><b class='flag-5'>算</b>领域的实践