0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm Neoverse与AWS Graviton4加速云计算创新

Arm社区 来源:Arm社区 2024-12-17 10:16 次阅读

作者:Arm 基础设施事业部服务器生态系统开发总监

Bhumik Patel

随着人工智能 (AI) 技术的迅猛发展,云计算领域正在经历显著变革。愈发复杂的 AI 应用对计算解决方案的性能、效率和成本效益提出了更高要求。在云端部署工作负载的客户正在重新评估其所需的基础设施,以满足现代工作负载需求,其中不仅包括提高性能和降低成本,还涵盖了需符合监管要求或可持续发展目标的新能效基准。

Arm 与亚马逊科技 (AWS) 长期合作,为实现性能更强劲、更高效和可持续的云计算提供专用芯片和计算技术。在近期举行的 AWS re:Invent 2024 大会上,AWS 进一步展示了 AWS Graviton4 所取得的显著进展,使开发者和企业能够充分发挥其云工作负载的性能潜力。

卓越的性能表现

相较于上一代 Graviton3 处理器,基于 Arm Neoverse V2 平台的 AWS Graviton4 处理器在计算性能上提升了 30%,核心数增加了 50%,内存带宽提高了 75%。凭借这些技术优势,AWS Graviton 处理器在生态系统和客户群体中得到了广泛应用。

Arm Neoverse V2 平台涵盖 Armv9 架构的新特性,包括高性能浮点和向量指令支持,以及 SVE/SVE2、Bfloat16 和 INT8 MatMul 等特性。这些特性为 AI/机器学习 (ML) 以及高性能计算 (HPC) 工作负载提供了卓越性能。

AI/ML 工作负载

今年早些时候,Arm 与主流的 AI 框架和软件生态系统合作,推出了 Arm Kleidi 软件,以确保 Arm 平台上开机即用的推理性能优化能惠及整个 ML 栈,开发者无需掌握额外的 Arm 专业知识即可构建其工作负载,从而进一步推动 AI 工作负载的广泛应用。此前,我们已展示了 PyTorch 中的这些优化如何赋能 AWS Graviton4 上运行大语言模型 (LLM),如 Llama 3 70B 和 Llama 3.1 8B,并显著改善了每秒生成词元 (token) 数和词元首次响应时间的表现指标。

欢迎阅读《Arm KleidiAI 助力提升 PyTorch 上 LLM 推理性能》一文,详细了解性能指标的提升细节。

HPC 和 EDA 工作负载

对于 HPC 工作负载,Graviton4 相较于 Graviton3E 在功能上实现了显著提升。每个核心的主内存带宽增加了16%,每个 vCPU 的 L2 缓存容量翻倍。这些改进对于 HPC 应用的性能至关重要,因为 HPC 应用通常受限于内存带宽。AWS 已经在这些领域取得了显著优势,如下所示。

根据 Arm 工程团队实际运行 EDA 工作负载所得出的结果,Graviton4 提供的 RTL 仿真工作负载性能比 Graviton3 高出 37%。

生态系统广泛采用

近年来,随着云计算用户将各种云工作负载部署在 AWS Graviton 处理器上,其软件生态系统持续扩展。如此一来,客户不仅节省了费用,收获了性能的提升,还能优化其碳足迹和可持续发展足迹。以下是部分示例:

着手利用 Graviton 的强大性能

我们坚信 Arm 将在云计算的未来中发挥关键作用,同时我们也非常自豪能够支持 AWS Graviton 立于技术创新的前沿。Arm 将继续投入,进一步强化我们的软件生态系统,从而使开发者能够更加轻松地在 Arm 平台上构建其应用,并充分利用 Arm 计算平台所提供的卓越性能和效率优势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19242

    浏览量

    229593
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9079

    浏览量

    367293
  • 云计算
    +关注

    关注

    39

    文章

    7769

    浏览量

    137330
  • AI
    AI
    +关注

    关注

    87

    文章

    30643

    浏览量

    268822

原文标题:Arm Neoverse 赋能 AWS Graviton4 处理器,加速云计算创新

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Arm Neoverse如何加速实现AI数据中心

    在快速演进的计算和人工智能 (AI) 时代,企业需要能助力其优化性能、降低成本并在市场竞争中保持领先的方法。Arm Neoverse 已成为众多前沿企业的选择,他们希望在推动
    的头像 发表于 11-26 09:30 313次阅读

    亚马逊科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g实例正式可用

    北京2024年7月15日 /美通社/ -- 亚马逊科技宣布基于自研芯片Amazon Graviton4处理器的Amazon Elastic Compute Cloud (Amazon EC2
    的头像 发表于 07-15 16:09 368次阅读

    亚马逊网络服务即将推出第四代Graviton处理器

    7月10日,雅虎财经独家报道了亚马逊网络服务(AWS)即将推出的重大技术进展——其第四代Graviton处理器,即Graviton4芯片。这一重要信息由AWS
    的头像 发表于 07-10 15:51 611次阅读

    ARM进军汽车芯片市场,推出Neoverse设计

    近日,全球知名的移动芯片设计公司ARM宣布迈出重大步伐,正式推出专为汽车领域设计的芯片——Neoverse。这一创新不仅展示了ARM在芯片设计领域的领先地位,也为汽车行业带来了前所未有
    的头像 发表于 05-20 10:46 659次阅读

    ArmArm Neoverse计算子系统(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

    Arm宣布了两款新的Arm Neoverse计算子系统(CSS),它们基于“迄今为止最好的一代Neoverse技术”。是什么让这些新产品在拥
    的头像 发表于 04-24 17:53 1041次阅读
    <b class='flag-5'>Arm</b>新<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b><b class='flag-5'>计算</b>子系统(CSS):<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS V3和<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS N3

    Google Cloud推出基于Arm Neoverse V2定制Google Axion处理器

    Arm Neoverse 平台已成为服务提供商优化其从芯片到软件全栈的心仪之选。近日,Google Cloud 推出了基于 Arm Neovers
    的头像 发表于 04-16 14:30 633次阅读

    stm32 AWS连接怎么使用?

    stm32 AWS连接怎么使用,官方的扩展包看不明白
    发表于 04-01 07:21

    Arm Neoverse CSS V3 助力计算实现 TCO 优化的机密计算

    (HPC) 和人工智能 (AI) 领域。亚马逊科技 (AWS) 在 re:Invent 2023 上宣布推出 AWS Graviton4 CPU。与前代
    发表于 03-26 16:37 336次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS V3 助力<b class='flag-5'>云</b><b class='flag-5'>计算</b>实现 TCO 优化的机密<b class='flag-5'>计算</b>

    Arm Neoverse S3 系统 IP 为打造机密计算和多芯粒基础设施 SoC 夯实根基

    Arm 基础设施事业部高级产品经理 Mohit Taneja   Arm Neoverse S3 是 Arm 专门面向基础设施的第三代系统 IP,应用范围涵盖高性能
    发表于 03-26 16:33 765次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> S3 系统 IP 为打造机密<b class='flag-5'>计算</b>和多芯粒基础设施 SoC 夯实根基

    Neoverse CSS V3助力计算实现TCO优化的机密计算

    Arm Neoverse 旨在为从到边缘的全场景基础设施用例提供高性能和出色能效。针对需要更高性能的工作负载和用例,Arm 推出了 Neovers
    的头像 发表于 03-14 12:13 514次阅读
    <b class='flag-5'>Neoverse</b> CSS V3助力<b class='flag-5'>云</b><b class='flag-5'>计算</b>实现TCO优化的机密<b class='flag-5'>计算</b>

    Arm Neoverse CSS N3助力快速实现出色能效

    到边缘,Arm Neoverse 正凭借出色的性能、效率、设计灵活性和总体拥有成本 (TCO) 优势,革新传统基础设施芯片领域。
    的头像 发表于 02-29 13:36 416次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS N3助力快速实现出色能效

    Arm发布Neoverse V3和N3 CPU内核

    计算市场持续迎来变革的背景下,Arm公司发布了其最新一代Neoverse CPU内核设计,分别为Neoverse V3(代号Poseidon)和N3(代号Hermes),两款内核将为
    的头像 发表于 02-27 09:27 948次阅读
    <b class='flag-5'>Arm</b>发布<b class='flag-5'>Neoverse</b> V3和N3 CPU内核

    FunASR语音大模型在Arm Neoverse平台上的优化实践流程

    Arm 架构在服务器领域发展势头前景看好。目前已有许多头部服务提供商和服务器制造商推出了基于 Arm Neoverse 平台的服务器产品
    的头像 发表于 02-22 13:41 2470次阅读
    FunASR语音大模型在<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>平台上的优化实践流程

    Arm 更新 Neoverse 产品路线图,实现基于 Arm 平台的人工智能基础设施

    新闻重点: Arm 宣布推出两款基于全新第三代 Neoverse IP 构建的新的 Arm Neoverse 计算子系统
    发表于 02-22 11:41 378次阅读

    智原与Arm合作提供基于Arm Neoverse CSS的设计服务

    Arm解决方案上的卓越设计实力以及对制造端资源的承诺。智原将充分发挥Arm Neoverse计算子系统(CSS)的优势,致力于提供卓越性能和创新
    的头像 发表于 01-10 16:29 729次阅读