0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ARM Cortex-A78、Cortex-X1、Mali-G78三种技术对比

454398 来源:电脑爱好者 作者:电脑爱好者 2020-08-11 17:29 次阅读

2019年5月,ARM发布了Cortex-A77 CPU和Mali-G77 GPU架构(准确说是IP,又称内核授权),刚刚量产的天玑1000+就是首款同时采用上述IP组合的旗舰级5G SoC。

ARM正式发布了下一代IP,由Cortex-X1、Cortex-A78和Mali-G78组成的“三剑客”,从即将在今年9月发布的麒麟1000开始,未来的5G SoC都将因它们而获益,并有望进一步拉近与同期苹果A系列SoC的性能差距。

那么,ARM新一代的“三剑客”都有啥特色?

骁龙865为啥最厉害?CPU和GPU架构了解下!

硬核科普!为啥说SoC的性能取决于架构和工艺?

麒麟990的最大遗憾!ARM Cortex-A77架构到底好在哪?

自研才是出路!看高通和三星如何怒怼苹果A11处理器

为啥iPhone总能默秒全?这才是苹果骄傲的本钱!

Cortex-A78:常规迭代更新

目前,骁龙865、天玑1000和Exyno 980等5G SoC都拿Cortex-A77架构作为CPU中的“大核”,也因此获得了强悍的运算动力。

作为Cortex-A77的接班人,Cortex-A78其实并没有什么本质上的变化,Cortex-A76、A77、A78都采用了相同的Austin微架构,三代核心在设计上存在很多共性。

用ARM的话来说,就是芯片供应商(如高通联发科等)在构建核心时可以非常容易地升级SoC的IP设计,不会花费太多经历和成本,从而缩短了开发周期。

因此,大家不要对Cortex-A78性能抱有太大期待,ARM官方数据显示,A78相较于A77,其IPC(架构性能)只提升了7%,功耗降低了4%,内核小了5%,四核簇面积的缩小了15%。

还好,与Cortex-A78搭配的是最新一代的5nm制程工艺,天生就具备更好的能效比。

现在SoC内单个“大核”在满载时的功耗约为1W,此时7nm工艺生产的Cortex-A77可以跑到2.6GHz,而5nm工艺生产的Cortex-A78则可达到3GHz,相当于在相同功耗下获得了20%的性能提升。

另一方面,在相同的性能下,5nm工艺生产的2.1GHz Cortex-A78功耗比7nm工艺2.3GHz的Cortex-A77降低了50%,有助于提高5G手机的续航。

说实话,ARM的这种计算方式令人头大,不合理也不公平。如果Cortex-A77也用5nm工艺生产,性能也会比7nm工艺时提升不少,功耗也会明显下降。

反之,如果用7nm工艺生产Cortex-A78,其性能和功耗表现也不见得比Cortex-A77好多少。

只是,新工艺和新架构搭配是科技发展的趋势也最经济,还利于宣传。所以咱们也就别较真儿了。

Cortex-X1:自研的终结

从iPhone 5开始,苹果A系列处理器就开始了“自研”之旅,而这也是为什么每一代iPhone的性能几乎都可以领先同期Android手机圈的所有处理器。

所谓的“自研”,就是购买ARM最高级的指令集授权,然后根据自身需要开发兼容ARM的架构,能领先ARM公版的Cortex-A架构多少全看芯片商的技术水平。

高通曾在骁龙600/800时代采用过自研的Krait架构,距离最新的骁龙820也是自研的Kyro。只是,高通发现自研架构的能耗比很难领先公版Cortex-A架构太多,不经济,所以从骁龙835开始就采取了BoC战略,也就是咱们常说的“魔改”,基于现有的公版Cortex-A架构进行版定制化。

华为从麒麟980开始,也采用了类似的思路,其大核也是基于Cortex-A架构进行了“based”,同样是一种魔改。需要注意的是,公版Cortex-A架构可以进行“魔改”的地方并不多,大家基本都是拿缓存部分开刀,所以无论是高通还是麒麟,其魔改后的内核与公版架构之间的性能差异并不大,关键还是看主频。

三星从Exynos 8890开始也加入到自研大军,并推出了名为猫鼬(Mongoose)的架构核心。但是,经过四代自主研发后,三星在2019年底已经决定放弃自研的Mongoose内核,并解散了位于德州奥斯汀的整个研发团队,未来将全面使用ARM的设计方案。

可见,除了苹果,其他芯片商的自研之路可谓一路荆棘,费力不讨好。

好消息是,ARM此次发布的“三剑客”中的Cortex-X1,其实就是一种允许芯片商在其上进行高度定制的IP内核,可以完全取代辛苦的“自研”之路。

从ARM公布的架构细节上来看,Cortex-X1与Cortex-A78都是ARMv8.2指令集下的,指令集是兼容的,但Cortex-X1是自定义CPU核,解码带宽从4路提升到5路,增加了25%,NEON浮点从2条128b提升到了4条128b,相当于浮点性能翻倍。缓存方面,Cortex-X1的L1缓存可达64KB,L2缓存1MB,L3缓存可达8MB,是Cortex-A78的两倍。

基于以上的改进,Cortex-X1较之上一代A77,其单核性能可提升30%、AI性能更是大涨100%。

按照ARM的规划,未来Cortex-X1将扮演旗舰级5G SoC内的“超大核”,而Cortex-A78则属于普通的“大核”,再与Cortex-A55构成“1+3+4”的三丛集DynamIQ集群,以实现性能和功耗的完美平衡。

唯一可惜的,就是Cortex-X1内核会占用更大的封装面积。ARM的资料显示,4个Cortex-A78核心在搭配4MB L3缓存时,其性能比前代A77可提升20%,同时核心面积降低15%;而1个Cortex-X1+3个Cortex-A78在搭配8MB L3缓存时,虽然核心面积会增加15%,但峰值性能提升了30%。

换句话说,Cortex-X1至少可以带来比Cortex-A78额外的10%的性能提升,看起来也不大啊?

Mali-G78:计算单元暴增

在Android领域,ARM公版的Mali系列GPU已经一枝独秀,昔日的老对手PowerVR已被边缘化。而新一代Mali-G78 GPU的问世,将进一步巩固ARM的亲儿子在GPU领域的领先地位。

也许是没有太大的竞争压力,所以Mali-G78依旧沿用了Mali-G77采用的Valhall图形架构,但它对全局时钟域进行了优化,改为全新的两级结构,实现了上层共享GPU模块与实际着色器核心频率的分离,也就是异步时钟域。这样一来,GPU的核心可以工作在与其他部分不同的频率上,可快可慢,从而解决几何输出与计算、纹理、引擎之间的不平衡问题,还能让GPU运行在不同电压上,从而降低功耗、提高能效,这也是桌面级CPU、GPU通用的做法。

此外,Mali-G78还彻底重写了FMA(融合乘加)引擎,包括新的乘法架构、新的加法架构、FP32/FP16浮点,可以节省30%的功耗。

在Mali-G77时代,最多可以搭配16个计算单元,也就是Mali-G77 MC16,但受制于成本、发热和功耗,哪怕是最激进的Exynos 990也才用了11个计算单元,即Mali-G77 MC11,天玑1000+则配备了Mali-G77 MC9。

这一次,Mali-G78最多可以武装24个计算单元,较之前辈增加了50%。但正如上面的原因,哪怕搭配最新的5nm工艺,估计实际商用的最大规模也就是16个左右,再多手机散热就压不住了。

根据ARM的资料显示,得益于综合架构、工艺等各方面的改进,Mali-G78相比于Mali-G77的性能提升幅度可达25%,即便是在同等工艺条件下也可提升15%, 同时能效提升10%,机器学习性能提升15%。

看起来还不错。

此外,ARM还新推出了Mali-G68 GPU,用于填补Mali-G7系列和Mali-G5系之间的空白。从现有的资料来看,Mali-G68的架构和参数和Mali-G78一模一样,只是最多仅能搭配6个计算单元。

换句话说,搭配1~6个计算单元的Mali-G78就叫Mali-G68,超过6个计算单元的则是Mali-G77。

即将在9月份发布的麒麟1000系列应该是首发Cortex-A78和Mali-G78的5G SoC,但它能否用上Cortex-X1架构还不得而知。而明年上市的骁龙875、天玑2000和Exyno 1000系列也将用上“三剑客”中的至少1个成员,至于它们实际性能较之现有的旗舰能有多少提升,就让我们拭目以待吧。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9040

    浏览量

    366730
  • Cortex
    +关注

    关注

    2

    文章

    202

    浏览量

    46436
  • Mali
    +关注

    关注

    0

    文章

    3

    浏览量

    8877
收藏 人收藏

    评论

    相关推荐

    ARM 最新公布Cortex-A78 CPU,并首次推出Cortex-X系列CPU

    5月27日消息,据外媒theverge报道,ARM于26日正式公布了其最新产品Cortex-A78CPU和Mali-G78GPU,并表示将用于2021年及以后的下一代旗舰智能手机。 ARM
    的头像 发表于 05-27 10:21 1.1w次阅读

    小编科普Cortex-A78的性能有哪些?

    小编科普Cortex-A78到底是什么?Cortex-A78的性能有哪些?与Cortex-A78相比,有哪些地方得到了提升?
    发表于 06-18 07:54

    Arm CortexA78AE核心技术参考手册

    Cortex®‑A78AE核心是一款高性能、低功耗的Arm产品,可实现ynamIQ共享单元AE(DSU-AE)集群内的Arm®v8‑A体系结
    发表于 08-08 07:11

    Mali-G78性能计数器1.2参考指南

    本指南解释了Mali-G78 GPU的Arm Streamline评测模板中的马里性能计数器,该模板是Valhall架构系列的一部分。 Streamline中的计数器模板遵循循序渐进的分析工作流
    发表于 08-11 06:18

    Arm Cortex-A78 Core技术参考手册

    技术参考手册适用于Cortex®-A78内核。 它提供参考文档并包含寄存器的编程详细信息。 它还描述了内存系统、缓存、中断和调试功能。
    发表于 08-18 07:01

    Arm即将推出新一代的旗舰CPU、GPU和NPU

    Arm宣布推出用于旗舰型手机的新款处理器IP系列:Cortex-X1 CPU,Cortex-A78 CPU,Mali-G78 GPU和Ethos-N
    的头像 发表于 05-28 11:21 4164次阅读
    <b class='flag-5'>Arm</b>即将推出新一代的旗舰CPU、GPU和NPU

    ARM推出高性能Cortex-A78C架构 面向笔记本等产品

    在上半年,ARM就已经推出了新一代移动处理器架构Cortex-A78,同时还带来了Mali-G78 GPU和Ehos-N78 NPU等,其中的Cor
    的头像 发表于 11-04 16:18 1767次阅读

    星正式宣布了新的Exynos 1080 SoC

    此外,新芯片还利用了新的ARM Cortex-A78 CPU架构以及新的Mali-G78架构。根据ARM的官方数据,A78与上一代
    的头像 发表于 10-11 09:34 2184次阅读

    Exynos 2100支持14个图形内核的ARM Mali-G78 GPU

    来自技巧专家Ice Universe的新信息讨论了Exynos 2100和Snapdragon 875的图形性能是否相等。他指出,Exynos 2100将配备具有14个图形内核的ARM Mali-G78 GPU
    的头像 发表于 10-16 10:57 3143次阅读

    ARM发布Cortex A78C增强版大核架构

    今年5月,ARM官宣了最新一代移动处理器架构Cortex-A78,同时登场的还有Mali-G78 GPU、Ehos-N78 NPU等。
    的头像 发表于 11-04 09:13 3646次阅读

    ARM发布A78C增强版大核架构,优化笔记本电脑

    今年5月,ARM官宣了最新一代移动处理器架构Cortex-A78,同时登场的还有Mali-G78 GPU、Ehos-N78 NPU等。
    的头像 发表于 11-04 10:41 1626次阅读

    Arm发布新的Cortex-A78C CPU,预计将为移动设备供电

    Arm于去年五月宣布了将为下一代移动和嵌入式处理器提供动力的技术。其中包括Cortex-A78 CPU和匹配的Mali-G78 GPU。这些可能主要用于移动设备,但
    的头像 发表于 11-05 15:41 1773次阅读

    星Exynos 1080芯片将由vivo X60系列首发

    Cortex-A78内核、3个主频2.0GHz的Cortex-A55 内核。星宣称,Exynos 1080的单核性能相比前代提升了1.5倍,多核性能提升了2倍。 Exynos 1080还首发了
    的头像 发表于 12-15 14:45 1756次阅读

    星正式发布 5nm 芯片 Exynos 2100:Cortex-X1 超大核,性能大幅提升

    Cortex-X1 超大核,Cortex-A78 核心和四个 Cortex-A55 核心。 星表示,与之前的产品相比,Exynos
    的头像 发表于 01-13 09:54 2080次阅读

    Cortex-X1 Arm全新Cortex-X1高性能CPU

    % 的峰值性能提升。 由于单Cortex-X1核心面积比A77和A78要大得多,所以不太可能采用原先的“4大 + 4小”设计,而是会按照Arm给出的“
    的头像 发表于 02-25 09:18 8496次阅读
    <b class='flag-5'>Cortex-X1</b> <b class='flag-5'>Arm</b>全新<b class='flag-5'>Cortex-X1</b>高性能CPU