0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm终端CSS为AI用户体验提供计算平台

Arm社区 来源:Arm社区 2024-05-30 11:35 次阅读

人工智能 (AI) 正在改变消费电子设备,并且革新生产力、创造力和娱乐体验,这将带来更高程度的自动化、沉浸感和个性化,为开发者和最终用户提供海量机会。随着推动移动端系统级芯片 (SoC) 的设备端生成式 AI 的发展,AI 技术正持续演进。

依托于Arm 全面计算解决方案的成功,我们宣布推出面向消费电子设备的全新计算子系统,即 Arm 终端计算子系统 (CSS)。作为 AI 体验的计算基础,它能在最广泛类别的消费电子设备中,实现性能、效率和可扩展性的跨越式提升。

Arm 终端 CSS 囊括最新的 Armv9.2 Cortex CPU 集群和 Arm Immortalis 与 Arm Mali GPU、CoreLink 互连系统 IP,以及知名代工厂采用三纳米工艺生产就绪的 CPU 和 GPU 物理实现。该平台为我们的合作伙伴提供了生产芯片的最快途径。通过物理实现,Arm 的合作伙伴能够利用前沿三纳米工艺的各种优势,同时实现高度灵活、可定制的芯片设计。

深入了解 Arm 终端 CSS

Arm 终端 CSS 采用最新 Armv9.2 CPU 集群,其中集成了 Arm 目前最高性能的 Arm Cortex-X925 CPU、最高效的 Cortex-A725 CPU 和更新后的 Cortex-A520 CPU。这为 AI 和其他实际用例计算工作负载提供出色的性能和效率。

2a53fb56-1e35-11ef-9bf9-92fbcf53809c.jpg

图:Arm 终端 CSS 涵盖哪些要素?

最新的 CoreLink 互连实现了 Arm 终端 CSS 的系统集成和扩展。集成的系统级缓存 (SLC) 通过减少 DRAM 带宽和访问来实现更出色的系统能效。系统内存管理单元 (SMMU) 通过第二阶段转换加强安全性,以便支持如安卓虚拟化框架 (AVF) 等虚拟化安全框架。

凭借基于第五代 GPU 架构、面向旗舰智能手机所设计的 Arm Immortalis-G925,Arm 终端 CSS 实现了惊人的图形和主机级别的游戏性能。通过增强的性能和能效,用户可以在移动设备上享受更长时间、更沉浸式的游戏体验。

Arm 终端 CSS 将成为第一代采用三纳米工艺节点的安卓 SoC 的一部分,从而在芯片中实现出色的功耗、性能和面积 (PPA)。作为终端 CSS 的一部分,Arm 的物理实现能够全面释放三纳米工艺技术的潜力,为高端平台充分发挥 PPA 优势,并为我们的合作伙伴打造芯片创建最快途径。

我们携手领先的代工厂合作伙伴,协同设计并交付 CPU 和 GPU 物理实现,其中包括流片就绪的 Cortex-X925 CPU 以及 Immortalis-G925 三纳米工艺的物理实现。这将有助于我们的合作伙伴在三纳米工艺上取得 PPA 优势,同时通过生产就绪的芯片解决方案来缩短芯片的开发与部署时间。此外,我们的合作伙伴能够灵活地使用 Arm 终端 CSS 来构建特定市场、具差异化特色的 CPU 集群和 GPU。

突破计算和 AI 性能的极限

终端 CSS 是 Arm 目前面向安卓系统速度最快的平台,与 2023 Arm 全面计算解决方案 (TCS23) 平台相比,在关键基准和一般计算用例方面取得了显著改进。其中包括:

通过 Geekbench 6 单核分数测量可知,得益于新的 Cortex-X925,峰值性能提高 36%;

在前十大应用中,五款应用的平均启动时间加快了 33%,不仅提高了生产力,也带来了流畅的移动体验;

通过 Speedometer 2.1 浏览器基准测量时,网页浏览速度加快了 60%;

在包括光线追踪和可变速率着色 (VRS) 基准等七项图形基准中,峰值图形性能平均提高 30%。

2abd1ab4-1e35-11ef-9bf9-92fbcf53809c.jpg

图:Arm 终端 CSS 的部分性能优势

Arm 终端 CSS 平台提供由 AI 驱动的消费电子设备体验。今年早些时候,我们展示了大语言模型 (LLM) 如何在移动设备上的 Arm CPU 进行本地运行。借助终端 CSS,LLM 将得以在 Arm CPU 上更好地运行,带来更快的响应速度。当运行 Llama 3 LLM 和 Phi-3 LLM 时,该平台可将词元 (Token) 首次响应时间分别缩短 42% 以及 46%。

2ace8a1a-1e35-11ef-9bf9-92fbcf53809c.jpg

图:通过 Arm 终端 CSS 在 Arm CPU 上运行 LLM

此外,得益于新 Arm CPU 和 GPU 所取得的技术进展,在广泛的通用 AI 网络上,Arm 终端 CSS 的 AI 推理性能获得了显著的提升。例如,采用 Cortex-X925 时,推理速度加快 59%;采用 Immortalis-G925 时,AI 推理速度加快 36%。此外,通过在终端 CSS 的 CPU 集群配置中利用一颗额外的 Cortex-X925 CPU,我们观察到在 17 个主流网络中,针对 int8 和 fp16 数据类型的 AI 推理性能提高了惊人的 2.7 倍。这些在 AI 推理方面的改进可在一系列 AI 用例中实现无缝顺畅的用户体验。

2b01986a-1e35-11ef-9bf9-92fbcf53809c.jpg

图:Arm 终端 CSS 提升 AI 推理

Arm 终端 CSS 在计算摄影和 AI 摄像头等 AI 用例中的表现尤为优异。要想拍摄出美轮美奂且具有逼真焦外成像效果(让背景模糊并聚焦所选主体)的照片和视频,这并非易事。AI 摄像头的焦外成像管线由深度估计、分割、抠图和混合等多个阶段组成,可生成高质量的影像结果。与 TCS23 相比,通过 CPU 上针对焦外成像工作负载的 AI 处理,终端 CSS 的焦外成像性能提升了 24%。这意味着用户可以在不影响电池续航时间的前提下,在照片和视频上获得更快、更顺畅的焦外成像效果。

2b244bbc-1e35-11ef-9bf9-92fbcf53809c.jpg

图:通过 Arm 终端 CSS 提升 AI 摄像头性能

此外,通过软件和工具的结合,Arm 终端 CSS 的性能与功耗得以获得进一步优化。Arm 新推出的 Kleidi 包含了经高度优化的机器学习 (ML) 软件内核集合 KleidiAI,能让开发者在通过高度优化的生成式 AI 框架运行 AI 工作负载时,全面释放 Arm CPU 的潜力。这意味着开发者能够面向各类设备,基于尽可能高的性能,快速构建 AI 应用。

为了获得更具沉浸感和更长时间的游戏体验,Arm 终端 CSS 实现了两位数的性能和能效提升,其中包括在一系列热门的手游中,平均以每秒 120 帧的速度运行时,在相同功耗下可带来 37% 的平均性能提升,同时 GPU 功耗降低 30%。

可扩展的性能覆盖各类消费电子设备市场

Arm 致力于让每个人都能享有 AI,并通过可应用在各类和各种不同外观设计的消费电子设备的终端 CSS,不断提升性能和效率。

Arm 终端 CSS 可扩展应用至市面上最高性能的消费电子设备,包括新一代 AI PC。其中的 Cortex-X925 与 Cortex-X4 CPU 相比,其 TOPS 提高 50%。终端 CSS 为 PC 市场提供专用的可扩展平台。该平台采用 Cortex-X925 以提供一流的单线程性能,并通过近期更新的 DSU-120(在单个 CPU 集群内提供多达 14 个 CPU 核心)提供最佳的性能可扩展性。除了 SVE2,更多的 Armv9 架构的功能,包括已在移动端生态系统验证的安全性技术,如指针验证 (PAC)、分支目标识别 (BTI)和内存标记扩展 (MTE) 等,也将引入 PC 市场。

通过终端 CSS,Arm 可为消费电子设备市场的各类性能和成本需求提供可获取的 AI 技术。Cortex-A725 是实现高能效 AI 吞吐量的主要处理器,在对成本更敏感的大众消费电子技术市场领域,它是 AI 处理的主力和主要开发者目标。例如,我们曾在一个虚拟助手演示中,展示了在搭载三核 Cortex-A700 系列 CPU 核心的现有安卓智能手机上,运行 Llama2-7B 和 Phi-3-mini (Phi-3 3.8B) LLM 的性能。与此同时,面积经优化的 Cortex-A725 可在广泛的消费电子技术领域中,以高面积效率实现生成式 AI 工作负载的部署。

消费电子技术的 AI 根基

Arm 终端 CSS 是为各类消费电子设备打造新一代 AI 体验的专用平台。终端 CSS 是 Arm 针对安卓系统速度最快的计算平台,这将使得用户能够在其移动设备上获得前所未有的安卓体验。该平台的 PPA 优势通过物理实现得以达成,助力我们的芯片合作伙伴缩短产品上市时间并顺畅部署。终端 CSS 的可扩展性能有助于在各种类型、不同外观设计的设备的所有成本点上释放 AI 性能,使得人人都能享有 AI。

2b6f2f42-1e35-11ef-9bf9-92fbcf53809c.jpg

Arm 终端 CSS 使得我们的生态系统能够实现更多突破,无论是释放更多性能、实现更多 AI 功能和应用体验,还是打造更先进的芯片,Arm 平台是这一切的基础。凭借终端 CSS,Arm 为当前和未来的 AI 体验构建消费电子计算的未来。


审核编辑:刘清
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 摄像头
    +关注

    关注

    59

    文章

    4761

    浏览量

    94671
  • SoC芯片
    +关注

    关注

    1

    文章

    587

    浏览量

    34774
  • 人工智能
    +关注

    关注

    1788

    文章

    46142

    浏览量

    235781
  • 机器学习
    +关注

    关注

    66

    文章

    8308

    浏览量

    131984

原文标题:Arm 终端 CSS 为 AI 用户体验提供计算平台

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Arm如何赋能无处不在的AI

    作为人工智能 (AI) 的创新基础,众多企业都在使用通用且应用广泛的 Arm 计算平台。迄今为止,合作伙伴基于 Arm 架构的芯片出货量已逾
    的头像 发表于 09-14 09:38 307次阅读

    芯品# 高性能计算芯片

    Arm Neoverse基于CSS的CPU芯片组具有超高速接口和高级封装,可为AI,HPC和网络基础设施提供可扩展的性能 英国伦敦和加拿大多伦多-2024年6月6日- Alphawav
    的头像 发表于 06-27 10:28 6808次阅读

    Arm终端CSS革新,加速端侧人工智能时代

    在当今信息化与智能化的交汇点,人工智能的发展势头正盛。尤其是在端侧人工智能领域,其对于计算平台的性能、能效以及集成度的要求日益提升。近日,全球领先的半导体知识产权(IP)提供Arm
    的头像 发表于 06-24 18:23 1376次阅读

    MediaTek加入Arm全面设计生态项目 塑造AI计算的未来

    MediaTek 今日于 COMPUTEX 2024 宣布加入 Arm 全面设计(Arm Total Design)生态项目。Arm 全面设计基于 Arm Neoverse
    的头像 发表于 06-04 20:09 1220次阅读
    MediaTek加入<b class='flag-5'>Arm</b>全面设计生态项目 塑造<b class='flag-5'>AI</b><b class='flag-5'>计算</b>的未来

    Arm发布全新终端计算子系统,加速AI体验与产品上市

    全球领先的半导体知识产权(IP)提供Arm控股有限公司(纳斯达克股票代码:ARM)今日正式推出全新的Arm终端
    的头像 发表于 05-30 14:23 484次阅读

    Arm宣布推出终端计算子系统(CSS),提供领先的人工智能体验

    Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)今日宣布推出 Arm® 终端计算
    的头像 发表于 05-30 14:11 1106次阅读
    <b class='flag-5'>Arm</b>宣布推出<b class='flag-5'>终端</b><b class='flag-5'>计算</b>子系统(<b class='flag-5'>CSS</b>),<b class='flag-5'>提供</b>领先的人工智能体验

    Arm推出AI优化的Arm终端CSS以及新的Arm Kleidi软件

    Arm 终端计算子系统 (CSS) 作为新的计算解决方案,结合了 Armv9 架构的优势,以及基于三纳米工艺节点,经过验证和证实为生产就绪的
    的头像 发表于 05-30 11:33 504次阅读
    <b class='flag-5'>Arm</b>推出<b class='flag-5'>AI</b>优化的<b class='flag-5'>Arm</b><b class='flag-5'>终端</b><b class='flag-5'>CSS</b>以及新的<b class='flag-5'>Arm</b> Kleidi软件

    ArmArm Neoverse计算子系统(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

    Arm宣布了两款新的Arm Neoverse计算子系统(CSS),它们基于“迄今为止最好的一代Neoverse技术”。是什么让这些新产品在拥挤的计算
    的头像 发表于 04-24 17:53 874次阅读
    <b class='flag-5'>Arm</b>新<b class='flag-5'>Arm</b> Neoverse<b class='flag-5'>计算</b>子系统(<b class='flag-5'>CSS</b>):<b class='flag-5'>Arm</b> Neoverse <b class='flag-5'>CSS</b> V3和<b class='flag-5'>Arm</b> Neoverse <b class='flag-5'>CSS</b> N3

    Arm Neoverse CSS V3 助力云计算实现 TCO 优化的机密计算

    的全场景基础设施用例提供高性能和出色能效。针对需要更高性能的工作负载和用例,Arm 推出了 Neoverse V 系列。其中,Neoverse V2 核心已被行业先行者广泛部署于云、高性能计算
    发表于 03-26 16:37 240次阅读
    <b class='flag-5'>Arm</b> Neoverse <b class='flag-5'>CSS</b> V3 助力云<b class='flag-5'>计算</b>实现 TCO 优化的机密<b class='flag-5'>计算</b>

    Arm发布新一代Neoverse数据中心计算平台AI负载性能显著提升

    据公开信息显示,Arm去年推出的Neoverse CSS运算子系统提供了包含处理器设计的预验证平台,加快了定制SoC上市进程,首发型号为Neoverse
    的头像 发表于 02-22 14:48 577次阅读

    Arm 更新 Neoverse 产品路线图,实现基于 Arm 平台的人工智能基础设施

    新闻重点: Arm 宣布推出两款基于全新第三代 Neoverse IP 构建的新的 Arm Neoverse 计算子系统 Arm Neoverse
    发表于 02-22 11:41 276次阅读

    智原与Arm合作提供基于Arm Neoverse CSS的设计服务

    Arm解决方案上的卓越设计实力以及对制造端资源的承诺。智原将充分发挥Arm Neoverse计算子系统(CSS)的优势,致力于提供卓越性能
    的头像 发表于 01-10 16:29 627次阅读

    高通通过终端AI领先技术 增强骁龙本、手机和耳机体验

    安蒙阐述了AI将对用户使用终端的方式产生深远影响,以及骁龙将如何在广泛的消费电子产品品类中提供终端AI
    的头像 发表于 10-27 13:56 532次阅读

    基于ARM11和Android嵌入式系统的全新的用户侧智能终端设计方案

    电子发烧友网站提供《基于ARM11和Android嵌入式系统的全新的用户侧智能终端设计方案.pdf》资料免费下载
    发表于 10-23 10:17 0次下载
    基于<b class='flag-5'>ARM</b>11和Android嵌入式系统的全新的<b class='flag-5'>用户</b>侧智能<b class='flag-5'>终端</b>设计方案

    Arm 全面设计”借助生态系统之力,拥抱 Arm 定制芯片时代

    Arm 今日宣布推出 “ Arm® 全面设计 (Arm Total Design) ” 生态系统,致力于流畅交付基于 Neoverse™ 计算子系统 (
    发表于 10-18 13:40 228次阅读