0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

强悍的AWS Graviton4处理器及其背后的Arm Neoverse

Felix分析 来源:电子发烧友 作者:吴子鹏 2024-12-19 00:04 次阅读

电子发烧友网报道(文/吴子鹏)在今年的亚马逊re:Invent 2024大会上,该公司正式对外发布了旗下第四代自研Arm芯片——Graviton4。作为目前最强大的Graviton处理器,Graviton4相较于上一代产品带来了巨大的性能提升。同时,为Graviton4赋能的Arm Neoverse也跟着受到了更多的关注。

强悍的Graviton4处理器

据介绍,Graviton4处理器每个核心都能提供比上代强30%的性能,vGPU数量和内存容量也是上一代的3倍,能将处理大型Java应用的速度提升45%,可以为企业提供更低成本和高效的高性能计算解决方案。

除了内核性能的提升,亚马逊还着重提升了Graviton4处理器的存储性能,首次创建了双插槽NUMA内存集群。Graviton4处理器配备了高达1.5 TB的DDR5主内存,运行频率为5.6 GHz,提供12个内存通道。与之相比,上一代Graviton 3处理器使用了4.8 GHz主频的DDR5内存,只有8个内存通道。并且,单个Graviton4处理器的内存插槽就可以提供537.6 GB/秒的带宽,能够轻松应对HPC负载。

此前,亚马逊针对Graviton4处理器发布过一些测试实例,通过这些实例体现了这颗处理器强大的性能。比如,基于Graviton4处理器构建UE5 Dedicated Server,据亚马逊的说法,最新的Graviton 4实例是迄今为止亚马逊为各种workload设计的最强大并且最高效节能的CPU。Graviton 4的实例R8g相较于Graviton 3的实例R7g有大约30%的性能提升。实例R8g压测使用Lyra Starter Game项目,通过增加AI Bot和GameClient的方式来增加Dedicated Server(简称DS)的负载,通过对比不同机型以及不同参数编译出的DS在server full的情况下的CPU使用率和帧率(FPS)来对比性能。

结果显示,Graviton 4的实例在UE Dedicated Server应用场景下:
·相较于Graviton 3有约 25+%的性价比提升(均使用优化参数编译);
·相较于Intel Sapphire Rapids和AMD Genoa有30%~35%的性价比提升;
·使用Graviton针对C/C++的优化参数来编译Dedicated Server对性能提升约10%~25%。

根据外媒的测试,在相同的vCPU数量下,新的Graviton4处理器内核大致与Intel Sapphire Rapids性能相当,同时能够与AMD EPYC“Genoa”相媲美,并始终表现出极佳的代际提升。这都离不开Arm Neoverse的赋能。

Graviton4 处理器背后的Arm Neoverse

Graviton4 处理器基于Arm Neoverse V2平台,这颗核心发布于2022年9月。Neoverse V2和Neoverse E2都是Arm公司内部代号“Demeter”项目下的产品,Arm Neoverse V2平台涵盖Armv9架构的新特性,包括高性能浮点和向量指令支持,以及SVE/SVE2、Bfloat16和INT8 MatMul等特性。这些特性为AI/机器学习 (ML) 以及高性能计算 (HPC) 工作负载提供了卓越性能。

根据Arm官方的介绍信息,得益于全面增强的核心性能、内存带宽和高达两倍的L2缓存大小(每核2MB),Neoverse V2可以在云和ML应用程序上提供两倍于Neoverse V1的性能。根据Arm工程团队实际运行EDA工作负载所得出的结果,Graviton4 提供的RTL仿真工作负载性能比Graviton3高出 37%。同时,Neoverse V2具有出色的平台扩展性,当与新的CMN-700核心网状网络配对时,Neoverse V2 CPU可以配置多达256个内核和512MB的系统级缓存(SLC)。AMBA CHI C2C使用UCIe、CXL、PCIe或自定义PHY来连接计算、内存和加速器,实现高效、高速的芯片连接。

看过Graviton4处理器的性能之后,人们对下一代Arm服务器会更加期待,这些产品将搭载最新的Neoverse V3。2024年2月,Arm宣布推出新一代 Arm Neoverse技术,Neoverse CSS V3则是V系列芯片IP的首款Neoverse CSS产品,单芯片性能可提高50%。官方的资料显示,全新的Neoverse CCS V3 核心基于64核的Neoverse V3 核心,拥有6个DDR5 内存控制器、4个 I/O 控制器和两个芯片间互连,并支持PCIe Gen5和CXL3.0。通过芯片间互联,可以升级至128核。相对于此前的 Neoverse CSS N2,其单芯片性能可提高50%。

除了核心的提升,Arm将继续投入并进一步强化软件生态系统,从而使开发者能够更加轻松地在 Arm平台上构建其应用,并充分利用 Arm计算平台所提供的卓越性能和效率优势。

结语

亚马逊Graviton4处理器是Arm处理器历史上的一次巨大成功,性能全面对标x86处理器当前的旗舰产品。在Graviton4处理器背后,Neoverse V2内核起到了巨大的赋能作用,这让产业界对于下一代基于Neoverse CCS V3 核心的Arm处理器更加期待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19245

    浏览量

    229599
收藏 人收藏

    评论

    相关推荐

    ArmAWS合作深化,AWS Graviton4展现显著进展

    :Invent 2024大会上,AWS进一步展示了其基于Arm架构的AWS Graviton4处理器的显著进展。
    的头像 发表于 12-18 14:17 72次阅读

    Arm NeoverseAWS Graviton4加速云计算创新

    随着人工智能 (AI) 技术的迅猛发展,云计算领域正在经历显著变革。愈发复杂的 AI 应用对计算解决方案的性能、效率和成本效益提出了更高要求。在云端部署工作负载的客户正在重新评估其所需的基础设施,以满足现代工作负载需求,其中不仅包括提高性能和降低成本,还涵盖了需符合监管要求或可持续发展目标的新能效基准。
    的头像 发表于 12-17 10:16 98次阅读

    基于全志V853处理器的智能辅助驾驶算法介绍

    全志V853处理器,是专为智慧视觉领域设计的AI处理器,配备了高效的NPU算力和丰富的外设接口,能够提供稳定的AI边缘计算支持;同时,基于V853处理器这一性能优势,全志还为客户提供了一整套完整的智能辅助驾驶算法。
    的头像 发表于 09-14 09:23 687次阅读
    基于全志V853<b class='flag-5'>处理器</b>的智能辅助驾驶算法介绍

    亚马逊云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g实例正式可用

    北京2024年7月15日 /美通社/ -- 亚马逊云科技宣布基于自研芯片Amazon Graviton4处理器的Amazon Elastic Compute Cloud (Amazon EC2
    的头像 发表于 07-15 16:09 369次阅读

    亚马逊网络服务即将推出第四代Graviton处理器

    7月10日,雅虎财经独家报道了亚马逊网络服务(AWS)即将推出的重大技术进展——其第四代Graviton处理器,即Graviton4芯片。这一重要信息由
    的头像 发表于 07-10 15:51 611次阅读

    SiPearl更新Rhea1处理器规格,聚焦HPC与AI推理应用

    据了解,Rhea1处理器将与英伟达GH200 Grace Hopper超级芯片共同为欧洲首台E级超算JUPITER提供计算能力,原本计划搭载72个Arm Neoverse V1 “Zeus”内核。
    的头像 发表于 05-15 11:41 367次阅读

    ArmArm Neoverse计算子系统(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

    Arm宣布了两款新的Arm Neoverse计算子系统(CSS),它们基于“迄今为止最好的一代Neoverse技术”。是什么让这些新产品在拥挤的计算技术领域脱颖而出?
    的头像 发表于 04-24 17:53 1041次阅读
    <b class='flag-5'>Arm</b>新<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>计算子系统(CSS):<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS V3和<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS N3

    Google Cloud推出基于Arm Neoverse V2定制Google Axion处理器

    Arm Neoverse 平台已成为云服务提供商优化其从芯片到软件全栈的心仪之选。近日,Google Cloud 推出了基于 Arm Neoverse V2 打造的定制 Google
    的头像 发表于 04-16 14:30 634次阅读

    适用于ARM Cortex®—A53处理器和FPGA TPS65219 数据表

    电子发烧友网站提供《适用于ARM Cortex®—A53处理器和FPGA TPS65219 数据表.pdf》资料免费下载
    发表于 04-01 16:23 0次下载
    适用于<b class='flag-5'>ARM</b> Cortex®—A53<b class='flag-5'>处理器</b>和FPGA TPS65219 数据表

    适用于ARM Cortex®—A53处理器A53处理器和FPGA的集成电源管理IC TPS65220数据表

    电子发烧友网站提供《适用于ARM Cortex®—A53处理器A53处理器和FPGA的集成电源管理IC TPS65220数据表.pdf》资料免费下载
    发表于 03-27 10:04 0次下载
    适用于<b class='flag-5'>ARM</b> Cortex®—A53<b class='flag-5'>处理器</b>A53<b class='flag-5'>处理器</b>和FPGA的集成电源管理IC TPS65220数据表

    Arm Neoverse CSS V3 助力云计算实现 TCO 优化的机密计算

    (HPC) 和人工智能 (AI) 领域。亚马逊云科技 (AWS) 在 re:Invent 2023 上宣布推出 AWS Graviton4 CPU。与前代 Graviton CPU
    发表于 03-26 16:37 338次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS V3 助力云计算实现 TCO 优化的机密计算

    ScaleFlux即将推出集成Arm Cortex-R82处理器的企业SSD控制

    ScaleFlux宣布,将在其即将推出的企业级固态硬盘(SSD)控制系列中整合Arm® Cortex®-R82处理器
    的头像 发表于 03-22 11:25 974次阅读

    瑞萨电子宣布推出基于Arm Cortex-M23处理器的RA2A2微控制产品群

    全球半导体解决方案供应商瑞萨电子(TSE:6723)今日宣布推出基于Arm Cortex-M23处理器的RA2A2微控制(MCU)产品群。
    的头像 发表于 03-22 10:57 688次阅读
    瑞萨电子宣布推出基于<b class='flag-5'>Arm</b> Cortex-M23<b class='flag-5'>处理器</b>的RA2A2微控制<b class='flag-5'>器</b>产品群

    适用于ARM Cortex—A53处理器和FPGA TPS65219数据表

    电子发烧友网站提供《适用于ARM Cortex—A53处理器和FPGA TPS65219数据表.pdf》资料免费下载
    发表于 03-06 14:46 0次下载
    适用于<b class='flag-5'>ARM</b> Cortex—A53<b class='flag-5'>处理器</b>和FPGA TPS65219数据表

    业界首款基于Arm Cortex-M85处理器的MCU

    所有RA8系列MCU均利用Arm Cortex-M85处理器Arm的Helium技术所带来的高性能,结合矢量/SIMD指令集扩展,能够在数字信号处理器(DSP)和机器学习(ML)的实
    发表于 03-05 14:14 705次阅读
    业界首款基于<b class='flag-5'>Arm</b> Cortex-M85<b class='flag-5'>处理器</b>的MCU