0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从Arm TCS23看Arm对移动设备未来的洞察

21克888 来源:电子发烧友网 作者:黄晶晶 2023-07-03 09:46 次阅读

5月29日Arm正式推出 Arm 2023 全面计算解决方案(TCS23), 包含基于全新第五代 GPU 架构、可实现终极视觉体验的全新Arm Immortalis GPU,助力 Arm 面向下一代人AI保持性能领先的全新 Armv9 CPU 集群,以及可为数百万 Arm 开发者提供更易访问软件的全新增强技术,为整个系统的关键工作负载带来了显著提升。

近日,在媒体技术日活动上,多位Arm技术专家来到现场分享了TCS23的技术特征以及智能移动设备发展的前瞻洞察。Arm 产品营销副总裁 Ian Smythe首先介绍了TCS23的整体性能优势。

全新 Armv9 Cortex 计算集群已连续三年实现两位数的性能提升。TCS23的计算集群包括超大核Cortex-X4,大核处理器 Cortex-A720 和小核 Cortex-A520。也推出了全新DSU-120 ,专门为了满足高要求的多线程用例而设计。基于第五代架构的 GPU即Immortalis-G720,专为旗舰智能手机而设计,可带来 15% 的性能提升,减少了多达 40% 的内存带宽用量,有助于实现更出色且持久的帧率,最终带来更高质量的图形。提供 64 位计算性能、支持安全创新,迁移到 64 位系统的任务已经完成。Arm 的内存标记扩展MTE 功能,支持开发者在应用部署前后,都能检测和避免内存安全漏洞。Ian还表示,在接下来的几年里,我们将在包括 Krake GPU 和 Blackhawk CPU 等关键 IP 上加大投入,以满足合作伙伴对于计算和图形性能的要求。

TCS23全面计算解决方案包括工具、软件以及各种硬件产品,例如Arm 架构以及再底层的物理 IP、POP IP。TCS23在底层 IP上有了全新的更新,同时在工具上也提供了新的产品,在GPU上新品,进一步提高性能和效率。同时,Arm还推出了仅支持 64 位、且基于 Armv9.2 架构的CPU集群,提供了全新的系统级IP 以及开发工具。

全面升级CPU核,以及DSU-120支持最高多达14个内核的可扩展配置


Cortex-X4 是Arm打造过性能最快速的CPU,与 Cortex-X3 相比,Cortex-X4 的性能提高了15%,并带来可以显著降低功耗多达 40% 的高能效微架构。而面积仅增加了 10%,这是Cortex-X系列处理器中,在每平方毫米的性能方面最出类拔萃的产品。不论是更快速的即时应用响应,或是更流畅的网页浏览体验, Cortex-X4 的增强性能将为设备带来显著的升级。包括 3A 级游戏、全天候生产力和后台任务在内的用例,是移动设备中极其重要的部分,而能效则是高效运行此类用例必不可少的关键。

全新的大核处理器 Cortex-A720 和全新小核 Cortex-A520,与其上一代相比,双双在能效方面都提高了 20%。Cortex-A720 是业界主流的 CPU IP,可提高持续性能,是新 CPU 集群的核心主力,而Cortex-A520 是我们最出众的高效性能核心。

由于高端移动设备的芯片设计越来越复杂,要面对用户体验的升级、新软件功能的需求和更高性能和效率的持续突破,TCS23基于全新 Armv9.2 架构搭建,可以为客户提供突破能效和性能边界所需的前沿技术,客户可以基于 TCS23 进行不同配置,从而自行创建可扩展性高的计算解决方案。这里不仅包括智能手机,还有高端数字电视、机顶盒等等。



Arm 终端事业部产品管理高级总监Kinjal Dave谈到,在Armv9.2 计算集群中除了全新 Cortex-X4、Cortex-A720 和 Cortex-A520 CPU,还有DynamIQ Shared Unit DSU-120。全新的 DSU-120基于两年前推出的 DSU-110 开发, 针对 DSU 的各方各面进行了优化提升。 在扩展性方面,新款 DSU-120 支持最高多达 14 个的内核和更大的L3缓存,可助力构建比前代产品更强大、性能更高的 CPU 集群。无论是搭载于高性能笔记本电脑中的由十核 Cortex-X4 和四核 Cortex-A720 CPU 所组成的集群,还是用于旗舰智能手机中的由单核 Cortex-X4、四核 Cortex-A720 和四核 Cortex-A520 所组成的集群,高度可扩展的 DSU 都为 Arm 2023 全面计算解决方案(TCS23)奠定了根基。

DSU-120 还提供了全新的先进功能,例如智能节能模式,它有助于提高整个 CPU 集群的效率。更高级别的效率表现能延长特定集群所针对的任何消费电子设备的工作天数。DSU-120 还新增了24MB 和 32MB的 L3 缓存配置选项,进而使得对应集群拥有更高的性能和更低的系统功耗。



在高端数字电视和机顶盒,以及中端智能手机应用中,TCS23配置侧重于提供具有超高可扩展性的高级图形和计算性能,实现出色的用户体验。举例来说,数字电视可以具备多视图功能,例如同时在屏幕上显示视频通话、视频流应用和 AI 应用等多个任务。更高的性能还可实现先进机器学习功能,以提升相机和视频应用场景的相关用户体验。

除此之外,TCS23 为注重成本的市场准备了多款配置选择,例如由全新 Cortex-A520 提供支持的可扩展 CPU 小核集群,以及可扩展的 Mali GPU。

GPU的三大关键提升

第五代架构提高了所有 GPU 的系统级图形性能,聚焦三个关键处理趋势,即场景复杂性、更出色的图形性能和内存系统能耗功率。




随着开发者纷纷设法实现更优质的视觉效果,移动设备上的场景复杂性也呈爆炸式增长。现在面临的挑战在于,更高的场景复杂性会让几何相关的内存访问占据过多的可用带宽,并最终影响性能。

为了处理这些更复杂的场景,图形管道首先引入了延迟顶点着色 (DVS) 以重新定义 Arm GPU 中的图形数据流。DVS 利于性能随内核数增加而提升,使 Arm 的合作伙伴能够在未来达到更高的性能水平。DVS 还有助于在高度复杂的游戏场景中保持稳定帧率,同时为未来下一代的几何内容提供支持。Immortalis-G720 有助于控制 HDR 渲染中使用的高深度纹理的性能影响。DVS 的引入意味着超复杂几何形状的场景可被渲染,并可节省处理能力。

Arm认为内存系统能耗功率是导致处理器散热达到极限的主要因素。在第五代架构中,希望为 GPU 分配更多的内存系统效能以达到更好的视觉效果,同时也希望可以进一步节约能耗功率,以延长电池续航时间。

除了引入第五代架构外,Immortalis 和 Mali GPU 的整体设计在性能和效率方面也实现了大幅提升。Immortalis-G720 支持十核或更多核心,并可选用优化的物理 IP 来加速 SoC 设计。Mali-G720 和 Mali-G620 的超强可扩展性有助于为广泛的消费电子设备带来优质的图形功能,例如智能手机、笔记本电脑、数字电视、机顶盒 (STB) 和可穿戴设备。Mali-G720 可支持六到九个核心,而 Mali-G620 可支持至多五个核心,可助力 Arm授权许可合作伙伴在更多市场中实现设计工作的快速复用。



3D 场景重建是一个关键的机器学习应用场景,可以在移动 GPU上渲染真实场景的新颖视图。并且在该应用下,与 Immortalis-G715 相比,Immortalis-G720 的峰值性能提高了25%,占用的内存带宽减少了22%。

开发者可利用 Unity ML-Agents插件在游戏和模拟中训练智能代理。在 GDC 2023 上,Arm展示了在移动 SoC 上处理 100 个类似代理和复杂图形的超强表现。



Arm通过广泛的 GPU 工具和资源保持对游戏开发者的生态系统支持。可从Arm Mobile Studio免费下载多种解析、性能分析和调试工具,以帮助开发者优化其应用的性能和效率。

软件优化不可或缺

以TCS23 中的软件来看包括三大支柱,即性能、安全以及开发者的可访问性。Arm 终端事业部生态系统及工程高级总监 Geraint North详细解析了TCS23 软件部分的提升。

机器学习是软件工作中非常重要的部分,因此在 TCS23 中我们更新了软件技术库。比如 Arm NN 以及 Arm Compute Library (ACL),这些都是开源的软件技术库,开发者可以利用它来优化在 Armv9架构 CPU 和 GPU 上面机器学习的复杂性。

自 2023 年 1 月以来,Arm NN和 ACL 已经通过谷歌的 Google Play Store 在安卓系统上提供,而且已经有超过 1 亿日活跃用户。此外,到 2024 年,不管是Arm NN还是 ACL 都可以使用谷歌的移动平台,意味着开发者能够在可下载的项目,在默认状态下更新到网络最新的版本,同时意味着能在基于 Arm 架构上实现开发者获得最高可能的机器学习的潜力。

多年以来,Arm一直在大量提供不断优化中的Mali GPU,赋能开发者,为他们免费提供了强大的开发工具,从而能够让他们在基于 Mali GPU 上实现最佳效果的设计。同时Arm还与全球主要的游戏引擎工作室进行多年的合作,一起推动图形技术的进步,并且以一种非常可扩展的方式实现产品的优化。

Arm 还为开发者提供丰富的培训以及最佳实践信息文件的分享,让开发者可以在开始构建图形时不断去改善他们的创意

除此之外,Arm 还为最新的工艺节点和库优化了IP,并且利用其在 RTL 方面的专长配置物理 IP,以此在先进的技术上为基于Arm架构的产品设计、制造提供了优化的EDA流程与物理实现。

软件越多越复杂,相对应漏洞也会增长,Arm 的内存标记扩展MTE 功能通过“锁”和“密钥”的设置避免内存安全漏洞。值得一提的是,TCS23是一个完全支持64位的集群,以利用完整的64位移动生态系统的优势。

小结:

TCS23基于最新一代的Armv9.2 架构,同时基于全新的DynamIQ共享单元之上,带来更多的可扩展性和更细致的电源控制模式,确保客户在需要的时候可以获得完整的性能和带宽,在不需要的时候可以通过非常细的颗粒度去降低功率。

从Arm对TCS23的部署也能够看到解决方案的灵活性和弹性,适用于智能手机、笔记本电脑等不同领域。与此同时,对于安全性、AI运算以及生态都进行大量优化和拓展。TCS23给广大客户提供了非常好的可扩展性,以期发挥架构带来的更大优势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9040

    浏览量

    366730
  • 移动设备
    +关注

    关注

    0

    文章

    492

    浏览量

    54641
收藏 人收藏

    评论

    相关推荐

    ARM技术是什么?国内有哪些ARM厂家呢?一起来了解一下!

    ,减少指令格式和寻址方式,这使得ARM处理器在执行效率上更高。 编辑搜图 请点击输入图片描述(最多18字) 低功耗设计 :ARM架构的芯片功耗较低,适合用于移动设备、物联网
    发表于 11-18 16:35

    Arm加入OpenCloudOS操作系统开源社区

    5G 基础设施和软件定义汽车,到移动端和嵌入式设备Arm 的开源工作覆盖全球技术生态系统的方方面面。持续的开源合作与技术创新赋能全球超过 2,000 万开发者在
    的头像 发表于 11-15 11:34 238次阅读

    Arm推出GitHub平台AI工具

    专为 GitHub Copilot 设计的 Arm 扩展程序,可加速云到边缘侧基于 Arm 平台的开发。
    的头像 发表于 11-01 13:50 212次阅读

    STM32到基于Arm的MSPM0的迁移指南

    电子发烧友网站提供《STM32到基于Arm的MSPM0的迁移指南.pdf》资料免费下载
    发表于 09-07 11:31 0次下载
    <b class='flag-5'>从</b>STM32到基于<b class='flag-5'>Arm</b>的MSPM0的迁移指南

    迁移到基于Arm STM32的MSPMO指南

    电子发烧友网站提供《迁移到基于Arm STM32的MSPMO指南.pdf》资料免费下载
    发表于 09-07 11:17 0次下载
    <b class='flag-5'>从</b>迁移到基于<b class='flag-5'>Arm</b> STM32的MSPMO指南

    Arm精锐超级分辨率技术解析

    近日,Arm 推出了 Arm 精锐超级分辨率技术 (Arm Accuracy Super Resolution, Arm ASR),这是一款面向移动
    的头像 发表于 09-03 11:28 861次阅读
    <b class='flag-5'>Arm</b>精锐超级分辨率技术解析

    Arm宣布专为移动游戏设计的图形优化方案

    Arm 近期宣布了其专为移动游戏设计的图形优化方案——Arm Accuracy Super Resolution(ASR),旨在显著提升游戏画面的视觉品质,同时有效控制智能手机的功耗。这一创新
    的头像 发表于 07-12 15:58 349次阅读

    ARM 主板:计算的未来

    和多功能性。在这篇博文中,我们将探索ARM主板的世界,并讨论为什么它们是计算的未来。首先,让我们了解一下什么是ARMARM代表高级RISC机器,是一种旨在实现节能和高
    的头像 发表于 06-21 17:16 469次阅读
    <b class='flag-5'>ARM</b> 主板:计算的<b class='flag-5'>未来</b>

    Arm预计未来五年将有1000亿台设备用于AI

    在COMPUTEX 2024展前活动中,Haas详解了其公司计划如何在2025年前,将逾千亿台Arm架构设备投入人工智能(AI)应用,涵盖云端到边缘侧的各个环节。
    的头像 发表于 06-06 16:29 605次阅读

    一文读懂RISC-V与ARM

    RISC-V和ARM是近年来备受关注的两种处理器架构。RISC-V是一种基于精简指令集计算(RISC)原理的开源指令集架构(ISA),而ARM是一种专有ISA,由于其长期存在于嵌入式系统和移动
    的头像 发表于 04-08 11:14 941次阅读
    一文读懂RISC-V与<b class='flag-5'>ARM</b>

    ARM®Cortex®-M23 32位MCU数据表

    电子发烧友网站提供《ARM®Cortex®-M23 32位MCU数据表.pdf》资料免费下载
    发表于 02-22 14:32 0次下载
    <b class='flag-5'>ARM</b>®Cortex®-M<b class='flag-5'>23</b> 32位MCU数据表

    CY8CPROTO-063-BLE是否可以ARM设备刷新PSoC6?

    是否可以ARM设备刷新PSoC6,在我的情况下 CY8CPROTO-063-BLE? 我想将 CY8CPROTO-063-BLE 连接到树莓派,并想从这个树莓派中烧录
    发表于 02-01 07:03

    TCS23的软件栈和FVP加速移动生态的产品开发方案一览

    今年五月,Arm 发布了 2023 全面计算解决方案 (TCS23)。TCS23 是面向移动计算的完整 IP 组合,也是我们有史以来最佳的面向智能手机的高端解决方案。
    的头像 发表于 12-13 16:37 453次阅读
    <b class='flag-5'>TCS23</b>的软件栈和FVP加速<b class='flag-5'>移动</b>生态的产品开发方案一览

    Arm笃定服务器市场,定制化芯片构建基础设施的未来

    ”为主题,围绕人工智能、机器学习、物联网、基础设施、汽车、终端、移动计算等行业热点话题展开。在此次大会上,Arm传递出对于服务器市场的处理器技术以及合作生态的最新洞察,并介绍了所推出的相关技术产品以大力支持基础设施的加速建设。
    的头像 发表于 12-04 14:42 1326次阅读
    <b class='flag-5'>Arm</b>笃定服务器市场,定制化芯片构建基础设施的<b class='flag-5'>未来</b>

    Arm携手MediaTek和vivo将TCS23运用于新一代旗舰智能手机

    2023 年五月,Arm 宣布推出移动计算平台——2023 全面计算解决方案 (Arm TCS23)。
    的头像 发表于 11-29 10:09 711次阅读