0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

详解Arm计算平台的优势

Arm社区 来源:Arm社区 2024-12-03 16:53 次阅读

对于人工智能 (AI) 而言,任何单一硬件或计算组件都无法成为适合各类工作负载的万能解决方案。AI 贯穿从云端到边缘侧的整个现代计算领域,为了满足不同的 AI 用例和需求,一个可以灵活使用 CPUGPU 和 NPU 等不同计算引擎的异构计算平台必不可少。

依托于 Arm CPU 的性能、能效、普及性、易于编程性和灵活性,从小型的嵌入式设备到大型的数据中心,Arm CPU 已经为各种平台上的 AI 加速奠定了基础。

就灵活性而言,这对生态系统大有裨益的三个主要原因是,首先,Arm CPU 可以处理广泛的 AI 推理用例,其中许多用例通常用于数十亿台设备,例如当今的智能手机、云和数据中心。不仅如此,除了推理之外,CPU 还经常用于技术栈中的数据预处理和编排等其他任务。其次,开发者能够在更多种类的数据格式中运行更广泛的软件,而无需构建多个版本的代码。最后,CPU 的灵活性使之成为加速 AI 工作负载的理想工具。

提供多样性和选择,助力行业灵活部署 AI 计算

除了 CPU 产品组合外,Arm 计算平台还包括 GPU 和 NPU 等 AI 加速器技术,许多市场都在将这些技术与 CPU 进行集成。

在移动端领域, Arm 终端计算子系统 (CSS) 包含 Armv9.2 CPU 集群,并与 Arm Immortalis-G925 GPU 集成,可为各种 AI 用例提供加速功能,包括图像分割、对象检测、自然语言处理和语音转文本等用例。在物联网 (IoT) 方面,Arm Ethos-U85 NPU 可与需要加速 AI 性能的基于 Arm Cortex-A 的系统一起设计,例如工厂自动化等场景。

此外,除了 Arm 自己的加速器技术外,合作伙伴借助我们的 CPU 灵活定制具有差异化的芯片解决方案。例如,NVIDIA 用于 AI 基础设施的 Grace Blackwell 和 Grace Hopper 超级芯片均采用了 Arm CPU 和 NVIDIA 的 AI 加速器技术,从而显著提升 AI 性能。

NVIDIA Grace Blackwell 超级芯片将 NVIDIA 的 Blackwell GPU 架构与基于 Arm Neoverse 的 Grace CPU 相结合。Arm 独特的产品组合使 NVIDIA 能够进行系统级设计优化,与 NVIDIA H100 GPU 相比,其能耗降低了 25 倍,单个 GPU 性能提高了 30 倍。具体来说,得益于 Arm Neoverse 平台的灵活性,NVIDIA 能够实现自有的高带宽 NVLink 互连技术,并提升 CPU、GPU 和内存之间的数据带宽和延迟。

Arm 致力于通过 Arm 全面设计生态项目,为整个生态系统注入 AI 加速的机遇。通过该生态项目,开发者可以更快访问 Arm CSS 技术,赋能软硬件技术进步,以此驱动 AI 和芯片创新,并加快开发和部署 AI 优化的芯片解决方案。

Arm 架构满足AI 所需的独特灵活性

Arm CPU 设计所具有灵活性关键在于我们领先的架构。它提供了一个可以与 AI 加速器技术紧密集成的基础平台,并支持从 128 位到 2,048 位的各种向量长度,可以在许多不同的数据点上轻松执行多个神经网络

Arm 架构的灵活性为整个芯片生态系统提供了多样化的定制机会,我们一直都致力于帮助合作伙伴更快地构建自己的差异化芯片解决方案。这种独特的灵活性也使 Arm 能够不断进行架构创新,定期推出关键指令和功能来加速 AI 计算,进而惠及整个生态系统,其中包括领先的芯片合作伙伴,以及在 Arm 计算平台上构建应用的 2,000 多万软件开发者等。

这一切始于 Armv7 架构,该架构引入了高级单指令多数据 (SIMD) 扩展,例如 Neon 技术,这是 Arm 首次涉足机器学习 (ML) 工作负载。在过去几年中,该架构不断增强,Armv8 中增加了向量点积和矩阵乘法特性,之后在 Armv9 中又引入了 Arm SVE2 和新的 Arm SME 技术,为广泛的生成式 AI 工作负载和用例提高了计算性能并降低了功耗。

与 AI 加速器技术无缝集成

Arm 是 AI 时代的计算平台,推动了持续的架构创新,以满足速度更快、互动性更好和沉浸感更强的 AI 应用的发展。Arm CPU 作为灵活处理 AI 工作负载的异构计算方法中的一部分,可以无缝增强和集成 GPU 和 NPU 等 AI 加速器技术。

Arm CPU 是处理众多 AI 推理工作负载的实用之选,凭借出色的灵活性,它能够与加速器技术无缝集成,打造更强大、更高性能的 AI 功能, 精准满足特定用例和计算需求。对于我们的技术合作伙伴而言,出色的灵活性有助于实现丰富的定制选择,使他们能够为 AI 工作负载构建完整的芯片解决方案。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9072

    浏览量

    367170
  • 数据中心
    +关注

    关注

    16

    文章

    4740

    浏览量

    72009
  • AI
    AI
    +关注

    关注

    87

    文章

    30503

    浏览量

    268741
  • 人工智能
    +关注

    关注

    1791

    文章

    47044

    浏览量

    238030

原文标题:一文详解 Arm 为何能成为适用于各类 AI 工作负载的计算平台

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    深度评测:云计算平台优势和不足

    计算平台具有成本效益、灵活性和可扩展性、简化维护和升级、全球访问性以及灾难恢复等优势,但也面临安全性问题、依赖性问题、合规性和隐私问题、性能限制以及迁移复杂性等挑战。企业在采用云计算
    的头像 发表于 11-22 10:48 134次阅读

    Arm推出GitHub平台AI工具

    专为 GitHub Copilot 设计的 Arm 扩展程序,可加速从云到边缘侧基于 Arm 平台的开发。
    的头像 发表于 11-01 13:50 257次阅读

    计算优势与应用

    计算是一种基于互联网的计算方式,通过互联网将算力以按需使用、按量付费的形式提供给用户,包括计算、存储、网络、数据库、大数据计算、大模型等算力形态。以下是对云
    的头像 发表于 10-24 09:12 413次阅读

    科研计算HPC平台是什么

    高性能计算平台(HPC平台)是一个利用由成千上万个处理器核心组成的超级计算机或计算机集群来执行复杂计算
    的头像 发表于 10-21 10:43 161次阅读

    AI云平台优势与应用

    AI云平台,作为AI技术与云计算深度融合的产物,正以其独特的优势,在全球范围内引领着技术创新和业务模式变革。
    的头像 发表于 10-12 09:44 184次阅读

    Arm如何赋能无处不在的AI

    作为人工智能 (AI) 的创新基础,众多企业都在使用通用且应用广泛的 Arm 计算平台。迄今为止,合作伙伴基于 Arm 架构的芯片出货量已逾 2,800 亿颗。如今,
    的头像 发表于 09-14 09:38 516次阅读

    浅析RISC-V领先ARM优势

    和灵活性使其适用于各种应用场景,包括嵌入式系统、移动设备、服务器、高性能计算等领域。随着RISC-V生态系统的不断发展壮大,RISC-V将在更多领域展现出其优势ARM虽然也在这些领域有所应用,但
    发表于 06-27 08:45

    基于FPGA的类脑计算平台 —PYNQ 集群的无监督图像识别类脑计算系统

    硬件平台 第一部分 设计概述 基金项目:国家自然科学基金“基于工作负载表征的类脑体系结构基准测试模型与自动映射方法研究”(61972180);数学工程与先进计算国家重点实验室开放基金
    发表于 06-25 18:35

    ARM 主板:计算的未来

    近年来,计算领域发生了重大转变。传统的基于x86的处理器几十年来一直占据市场主导地位,但现在基于ARM的处理器正在获得关注并彻底改变行业。ARM主板处于这场革命的前沿,提供全新级别的性能、效率
    的头像 发表于 06-21 17:16 509次阅读
    <b class='flag-5'>ARM</b> 主板:<b class='flag-5'>计算</b>的未来

    Arm推出AI优化的Arm终端CSS以及新的Arm Kleidi软件

    Arm 终端计算子系统 (CSS) 作为新的计算解决方案,结合了 Armv9 架构的优势,以及基于三纳米工艺节点,经过验证和证实为生产就绪的新 Ar
    的头像 发表于 05-30 11:33 632次阅读
    <b class='flag-5'>Arm</b>推出AI优化的<b class='flag-5'>Arm</b>终端CSS以及新的<b class='flag-5'>Arm</b> Kleidi软件

    全志T527芯片详解计算性能与高清图像编解码

    全志T527芯片详解计算性能与高清图像编解码
    的头像 发表于 05-21 14:37 2822次阅读
    全志T527芯片<b class='flag-5'>详解</b>:<b class='flag-5'>计算</b>性能与高清图像编解码

    ArmArm Neoverse计算子系统(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

    Arm宣布了两款新的Arm Neoverse计算子系统(CSS),它们基于“迄今为止最好的一代Neoverse技术”。是什么让这些新产品在拥挤的计算技术领域脱颖而出?
    的头像 发表于 04-24 17:53 1026次阅读
    <b class='flag-5'>Arm</b>新<b class='flag-5'>Arm</b> Neoverse<b class='flag-5'>计算</b>子系统(CSS):<b class='flag-5'>Arm</b> Neoverse CSS V3和<b class='flag-5'>Arm</b> Neoverse CSS N3

    ARM-based相比ARM cortex有何优势

    你看好ARM-based架构吗 相比ARM cortex有何优势 ARM其他还有什么架构啊,感觉曝光的好少。。
    发表于 04-24 06:55

    Arm邹挺:基于 Arm 平台,携手迈入构建计算未来的新篇章

    导体市场的分析与展望。   Arm 中国区业务全球副总裁 邹挺   重新上市,2023 年对Arm的里程碑意义   2023 年对于 Arm 而言是成绩斐然,并且具有里程碑意义的一年。我们于 2023 年 9 月再次上市,迈入构
    的头像 发表于 01-02 14:27 2742次阅读
    <b class='flag-5'>Arm</b>邹挺:基于 <b class='flag-5'>Arm</b> <b class='flag-5'>平台</b>,携手迈入构建<b class='flag-5'>计算</b>未来的新篇章

    边缘计算平台是什么配置的

    边缘计算平台是一个分布式计算架构,可以在靠近数据源的边缘设备上执行计算任务。它解决了传统计算模式下数据传输慢,延迟高的问题,使得数据的处理和
    的头像 发表于 12-27 15:23 882次阅读