最近Arm推出2023 全面计算解决方案(TCS23),发布最新CPU和GPU IP等产品。没有意外,高通和联发科的下一代旗舰手机SoC将采用Arm最新的CPU架构Cortex-X4,并且联发科还将以最新的Arm Immortalis-G720 IP为基础提升手机硬件光追的性能。Arm表示这是迄今最快的CPU和GPU,那么它们究竟有哪些提升呢?
Cortex-X4: 相比于 Cortex-X3,性能提高 15%,功耗降 40%
Cortex-X4是第四代X内核,基于全新的Armv9架构。得益于Armv9计算集群,处理器连续三年实现两位数的性能提升,Cortex-X4也同样如此。
与 Cortex-X3 相比,Cortex-X4 的性能提高15%,降低多达40%的功耗,而面积仅增加10%,Arm 中国区业务全球副总裁邹挺表示,这是Cortex-X系列处理器中,在每平方毫米的性能方面最出类拔萃的产品。
处理器的性能提升将带来更快速的即时应用响应,更流畅的网页浏览体验,在3A 级游戏、全天候生产力、后台任务等方面带给用户直观感受。
除了Cortex-X4超大核之外,Arm全新的大核处理器 Cortex-A720 和全新小核 Cortex-A520,与其上一代相比在能效方面都提高了20%。Cortex-A720 是业界主流的 CPU IP,主打高性能,可提高持续性能,是新CPU集群的核心主力。而Cortex-A520主打低功耗,是最出众的的高效性能核心。为了完善CPU 集群,Arm还推出了全新DSU-120 ,专门为了满足高要求的多线程用例而设计。
GPU——Immortalis-G720 :相比于 Immortalis-G715 ,性能和能效分别提高15%,系统级效率跃升 40%
此次发布的基于第五代架构的 GPU——Immortalis-G720,可带来15%的性能提升,减少多达 40%的内存带宽用量,有助于实现更出色且持久的帧率,最终带来更高质量的图形,实现更扣人心弦的视觉感受。在相同的配置下,相较于前一代产品,Immortalis-G720 的性能提高15%,而面积仅增加2%。而前一代产品已经证实在面积效率方面胜出相近竞品高达 20%。
邹挺表示,这是 Arm 有史以来效率最高的GPU架构,在设计时还兼顾了CPU和系统。该架构重新定义了部分图形管道,显著减少了内存带宽,从而让总体系统效率与功耗优化高达 14%。延迟顶点着色 (DVS) 的引入重新定义了GPU中的图形数据流,并将成为未来图形和几何复杂工作负载的关键,有助于合作伙伴扩展内核数量,并在未来达到更高的性能水平。
Arm 全新的GPU架构使下一代游戏和实时3D应用成为可能,让游戏体验更顺畅,并让复杂的PC 端和游戏主机体验在移动设备上实现。现在,游戏玩家喜欢的游戏可以通过更高帧率和经优化的高动态范围成像技术 HDR运行,带来更逼真的体验感,此外建筑师可以在现场直接通过建筑物实时 3D 效果图将计算机辅助设计 CAD 规划变为现实。
基于台积电N3E先进工艺,完成业内首个 Cortex-X4 流片
实现芯片的高效能离不开工艺的调优。Arm宣布目前已经在台积电N3E先进工艺上顺利完成了业内首个 Cortex-X4 的流片。邹挺也表示,Arm和台积电共同为 Arm Cortex-X4 内核打造定制 IP,为充分利用制程工艺和处理器带来的PPA 优势做好准备。这项合作为未来奠定了基础,通过设计分区和利用先进的封装技术,一同协作提高系统性能和能效。
邹挺谈到随着制程工艺的结合,将达到比上一代多的额外频率。通过提高处理器每时钟指令,来获得15%的性能提升。同时,降低功耗的关键之一是清楚地了解如何利用额外的 IPC,在更低的工作和电压点去运转,从而实现40%的能耗降低。
在系统优化方面,全新第五代 GPU 架构具有 DVS 功能,有助于优化系统级缓存的使用,同时新的 CPU 集群提供更多的 DSU 电源模式,以支持更高效地使用更大的 L3 缓存,并减少外部 DRAM 流量,从而实现性能更佳、效率更高的 SoC。在2023 全面计算解决方案中,在新版 CI-700 中引入了许多创新技术,进一步缩小了芯片面积。并将互连产生的延迟降低了 25%,同时优化了空闲电源,在不影响电池续航时间的前提下,实现了杰出的系统性能表现。
MTE 功能有助内存安全
Arm 的内存标记扩展MTE 功能,支持开发者在应用部署前后,都能检测和避免内存安全漏洞,为用户提供功能安全及信息安全的数字体验。通过 Armv9 架构的 CPU,Arm提供的MTE 功能能够消除占所有软件漏洞中 70% 的内存安全漏洞。
当前,企业和消费者市场都部署了相关解决方案。手机厂商荣耀最近宣布将向开发者提供支持 MTE 的设备。而作为潜心致力于保护隐私和安全的优秀短视频平台,快手也将进一步借助该技术优化改进其开发流程,为 3.6 亿日活用户带来更好的用户体验。
适应生成式AI应用
两周前,Google I/O 大会重点强调考虑把生成式 AI 引入到安卓生态系统,不久前,微软的 Build 开发者大会也在谈到把这些引入 Windows 11,从而让 Windows 的用户体验有进一步的提升。显然,生成式 AI 和大型语言模型是一个新兴领域。
在采访中Arm 高级副总裁兼终端事业部总经理Chris Bergey谈及他对生成式AI发展的看法,他说我们认为大型语言模型将塑造计算的未来,这意味着需要进一步提升AI方面的工作负载,而Arm 在这方面有非常深厚的储备,Arm CPU 和 GPU 的性能提升带动了 AI 处理能力大约每两年便会翻一番。
他进一步表示,Arm 正在通过相关工作以确保 AI 可以很好地在 Arm 架构上运行。我们相信未来将是一个比较混合(hybrid)的环境,大型语言模型在云端运行,但考虑到智能手机或其他计算设备上本地运行 AI 的隐私和能源效率等问题,用户可以更愿意在设备本机上运行较小的模型,如安卓。
Arm将继续推进对开源软件库Arm NN 和 Arm Compute Library 的支持,以便那些以世界上部署最多的平台 (即 Arm) 为目标的开发者能够继续利用类似 Chat GPT 或大型语言模型的应用程序来开发他们的应用。
自今年年初以来,Arm NN 和 Arm Compute Library 已在安卓平台上面向 Google Apps 开放,目前拥有超一亿的日活用户。明年年初,这些 Arm 技术库将通过谷歌移动服务向第三方应用程序的安卓开发者开放访问。将进一步助力开发者优化运行在 Armv9 CPU 和 Arm GPU 的机器学习工作负载,并预计未来的发展速度将会更快。
小结:
联发科已明确表示,Arm的2023 年 IP 极具创新力,Cortex-X4、Cortex-A720以及Immortalis-G720 为下一代天玑旗舰移动芯片奠定了良好的基础,我们将通过突破性的架构设计与技术创新提供令人惊叹的性能和能效。MediaTek 天玑移动芯片将结合 Arm 的先进技术,为用户开启移动新体验,带来更快的多任务处理、更出色的游戏与长续航表现。
可以肯定的是,Arm 2023 全面计算解决方案(TCS23)将带来旗舰智能手机性能的极大跃升。同时,Arm也透露正在加大投入下一代核心IP包括Krake GPU 和 Blackhawk CPU等,持续推进Arm全面计算解决方案的演进。
-
处理器
+关注
关注
68文章
19076浏览量
228685 -
soc
+关注
关注
38文章
4077浏览量
217680 -
生成式AI
+关注
关注
0文章
476浏览量
443
发布评论请先 登录
相关推荐
评论