5月29日Arm正式推出 Arm 2023 全面计算解决方案(TCS23), 包含基于全新第五代 GPU 架构、可实现终极视觉体验的全新Arm Immortalis GPU,助力 Arm 面向下一代人AI保持性能领先的全新 Armv9 CPU 集群,以及可为数百万 Arm 开发者提供更易访问软件的全新增强技术,为整个系统的关键工作负载带来了显著提升。
近日,在媒体技术日活动上,多位Arm技术专家来到现场分享了TCS23的技术特征以及智能移动设备发展的前瞻洞察。Arm 产品营销副总裁 Ian Smythe首先介绍了TCS23的整体性能优势。
全新 Armv9 Cortex 计算集群已连续三年实现两位数的性能提升。TCS23的计算集群包括超大核Cortex-X4,大核处理器 Cortex-A720 和小核 Cortex-A520。也推出了全新DSU-120 ,专门为了满足高要求的多线程用例而设计。基于第五代架构的 GPU即Immortalis-G720,专为旗舰智能手机而设计,可带来 15% 的性能提升,减少了多达 40% 的内存带宽用量,有助于实现更出色且持久的帧率,最终带来更高质量的图形。提供 64 位计算性能、支持安全创新,迁移到 64 位系统的任务已经完成。Arm 的内存标记扩展MTE 功能,支持开发者在应用部署前后,都能检测和避免内存安全漏洞。Ian还表示,在接下来的几年里,我们将在包括 Krake GPU 和 Blackhawk CPU 等关键 IP 上加大投入,以满足合作伙伴对于计算和图形性能的要求。
TCS23全面计算解决方案包括工具、软件以及各种硬件产品,例如Arm 架构以及再底层的物理 IP、POP IP。TCS23在底层 IP上有了全新的更新,同时在工具上也提供了新的产品,在GPU上新品,进一步提高性能和效率。同时,Arm还推出了仅支持 64 位、且基于 Armv9.2 架构的CPU集群,提供了全新的系统级IP 以及开发工具。
全面升级CPU核,以及DSU-120支持最高多达14个内核的可扩展配置
Cortex-X4 是Arm打造过性能最快速的CPU,与 Cortex-X3 相比,Cortex-X4 的性能提高了15%,并带来可以显著降低功耗多达 40% 的高能效微架构。而面积仅增加了 10%,这是Cortex-X系列处理器中,在每平方毫米的性能方面最出类拔萃的产品。不论是更快速的即时应用响应,或是更流畅的网页浏览体验, Cortex-X4 的增强性能将为设备带来显著的升级。包括 3A 级游戏、全天候生产力和后台任务在内的用例,是移动设备中极其重要的部分,而能效则是高效运行此类用例必不可少的关键。
全新的大核处理器 Cortex-A720 和全新小核 Cortex-A520,与其上一代相比,双双在能效方面都提高了 20%。Cortex-A720 是业界主流的 CPU IP,可提高持续性能,是新 CPU 集群的核心主力,而Cortex-A520 是我们最出众的高效性能核心。
由于高端移动设备的芯片设计越来越复杂,要面对用户体验的升级、新软件功能的需求和更高性能和效率的持续突破,TCS23基于全新 Armv9.2 架构搭建,可以为客户提供突破能效和性能边界所需的前沿技术,客户可以基于 TCS23 进行不同配置,从而自行创建可扩展性高的计算解决方案。这里不仅包括智能手机,还有高端数字电视、机顶盒等等。
Arm 终端事业部产品管理高级总监Kinjal Dave谈到,在Armv9.2 计算集群中除了全新 Cortex-X4、Cortex-A720 和 Cortex-A520 CPU,还有DynamIQ Shared Unit DSU-120。全新的 DSU-120基于两年前推出的 DSU-110 开发, 针对 DSU 的各方各面进行了优化提升。 在扩展性方面,新款 DSU-120 支持最高多达 14 个的内核和更大的L3缓存,可助力构建比前代产品更强大、性能更高的 CPU 集群。无论是搭载于高性能笔记本电脑中的由十核 Cortex-X4 和四核 Cortex-A720 CPU 所组成的集群,还是用于旗舰智能手机中的由单核 Cortex-X4、四核 Cortex-A720 和四核 Cortex-A520 所组成的集群,高度可扩展的 DSU 都为 Arm 2023 全面计算解决方案(TCS23)奠定了根基。
DSU-120 还提供了全新的先进功能,例如智能节能模式,它有助于提高整个 CPU 集群的效率。更高级别的效率表现能延长特定集群所针对的任何消费电子设备的工作天数。DSU-120 还新增了24MB 和 32MB的 L3 缓存配置选项,进而使得对应集群拥有更高的性能和更低的系统功耗。
在高端数字电视和机顶盒,以及中端智能手机应用中,TCS23配置侧重于提供具有超高可扩展性的高级图形和计算性能,实现出色的用户体验。举例来说,数字电视可以具备多视图功能,例如同时在屏幕上显示视频通话、视频流应用和 AI 应用等多个任务。更高的性能还可实现先进机器学习功能,以提升相机和视频应用场景的相关用户体验。
除此之外,TCS23 为注重成本的市场准备了多款配置选择,例如由全新 Cortex-A520 提供支持的可扩展 CPU 小核集群,以及可扩展的 Mali GPU。
GPU的三大关键提升
第五代架构提高了所有 GPU 的系统级图形性能,聚焦三个关键处理趋势,即场景复杂性、更出色的图形性能和内存系统能耗功率。
随着开发者纷纷设法实现更优质的视觉效果,移动设备上的场景复杂性也呈爆炸式增长。现在面临的挑战在于,更高的场景复杂性会让几何相关的内存访问占据过多的可用带宽,并最终影响性能。
为了处理这些更复杂的场景,图形管道首先引入了延迟顶点着色 (DVS) 以重新定义 Arm GPU 中的图形数据流。DVS 利于性能随内核数增加而提升,使 Arm 的合作伙伴能够在未来达到更高的性能水平。DVS 还有助于在高度复杂的游戏场景中保持稳定帧率,同时为未来下一代的几何内容提供支持。Immortalis-G720 有助于控制 HDR 渲染中使用的高深度纹理的性能影响。DVS 的引入意味着超复杂几何形状的场景可被渲染,并可节省处理能力。
Arm认为内存系统能耗功率是导致处理器散热达到极限的主要因素。在第五代架构中,希望为 GPU 分配更多的内存系统效能以达到更好的视觉效果,同时也希望可以进一步节约能耗功率,以延长电池续航时间。
除了引入第五代架构外,Immortalis 和 Mali GPU 的整体设计在性能和效率方面也实现了大幅提升。Immortalis-G720 支持十核或更多核心,并可选用优化的物理 IP 来加速 SoC 设计。Mali-G720 和 Mali-G620 的超强可扩展性有助于为广泛的消费电子设备带来优质的图形功能,例如智能手机、笔记本电脑、数字电视、机顶盒 (STB) 和可穿戴设备。Mali-G720 可支持六到九个核心,而 Mali-G620 可支持至多五个核心,可助力 Arm授权许可合作伙伴在更多市场中实现设计工作的快速复用。
3D 场景重建是一个关键的机器学习应用场景,可以在移动 GPU上渲染真实场景的新颖视图。并且在该应用下,与 Immortalis-G715 相比,Immortalis-G720 的峰值性能提高了25%,占用的内存带宽减少了22%。
开发者可利用 Unity ML-Agents插件在游戏和模拟中训练智能代理。在 GDC 2023 上,Arm展示了在移动 SoC 上处理 100 个类似代理和复杂图形的超强表现。
Arm通过广泛的 GPU 工具和资源保持对游戏开发者的生态系统支持。可从Arm Mobile Studio免费下载多种解析、性能分析和调试工具,以帮助开发者优化其应用的性能和效率。
软件优化不可或缺
以TCS23 中的软件来看包括三大支柱,即性能、安全以及开发者的可访问性。Arm 终端事业部生态系统及工程高级总监 Geraint North详细解析了TCS23 软件部分的提升。
机器学习是软件工作中非常重要的部分,因此在 TCS23 中我们更新了软件技术库。比如 Arm NN 以及 Arm Compute Library (ACL),这些都是开源的软件技术库,开发者可以利用它来优化在 Armv9架构 CPU 和 GPU 上面机器学习的复杂性。
自 2023 年 1 月以来,Arm NN和 ACL 已经通过谷歌的 Google Play Store 在安卓系统上提供,而且已经有超过 1 亿日活跃用户。此外,到 2024 年,不管是Arm NN还是 ACL 都可以使用谷歌的移动平台,意味着开发者能够在可下载的项目,在默认状态下更新到网络最新的版本,同时意味着能在基于 Arm 架构上实现开发者获得最高可能的机器学习的潜力。
多年以来,Arm一直在大量提供不断优化中的Mali GPU,赋能开发者,为他们免费提供了强大的开发工具,从而能够让他们在基于 Mali GPU 上实现最佳效果的设计。同时Arm还与全球主要的游戏引擎工作室进行多年的合作,一起推动图形技术的进步,并且以一种非常可扩展的方式实现产品的优化。
Arm 还为开发者提供丰富的培训以及最佳实践信息文件的分享,让开发者可以在开始构建图形时不断去改善他们的创意。
除此之外,Arm 还为最新的工艺节点和库优化了IP,并且利用其在 RTL 方面的专长配置物理 IP,以此在先进的技术上为基于Arm架构的产品设计、制造提供了优化的EDA流程与物理实现。
软件越多越复杂,相对应漏洞也会增长,Arm 的内存标记扩展MTE 功能通过“锁”和“密钥”的设置避免内存安全漏洞。值得一提的是,TCS23是一个完全支持64位的集群,以利用完整的64位移动生态系统的优势。
小结:
TCS23基于最新一代的Armv9.2 架构,同时基于全新的DynamIQ共享单元之上,带来更多的可扩展性和更细致的电源控制模式,确保客户在需要的时候可以获得完整的性能和带宽,在不需要的时候可以通过非常细的颗粒度去降低功率。
从Arm对TCS23的部署也能够看到解决方案的灵活性和弹性,适用于智能手机、笔记本电脑等不同领域。与此同时,对于安全性、AI运算以及生态都进行大量优化和拓展。TCS23给广大客户提供了非常好的可扩展性,以期发挥架构带来的更大优势。
-
ARM
+关注
关注
134文章
9040浏览量
366730 -
移动设备
+关注
关注
0文章
492浏览量
54641
发布评论请先 登录
相关推荐
评论