0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

骁龙865背后的CPU+GPU模块技术解析

454398 来源:cfan 作者:cfan 2020-08-19 10:48 次阅读

手机的“心脏”只有指甲盖大小,但凭借着高集成度的SoC身份,这种芯片却完美诠释了“麻雀虽小五脏俱全”的定义。

如果说指令集架构和制程工艺决定了SoC的天赋(详见《硬核科普!为啥说SoC的性能取决于架构和工艺?》),那SoC的直观战斗力则全看CPU+GPU模块的规格了。骁龙865之所以是Android手机圈综合性能最强的SoC,就是源于其集成的GPU更加强悍。

接下来,我们就将SoC分解,并先来看看影响其绝对性能的这两个关键模块。

*****CPU:性能基石*****

在SoC的组成部分中,CPU是最关键的核心单元之一,我们可以将它理解为PC上的酷睿处理器,而它的强弱主要受到以下几个参数的影响。

手机专用的SoC都属于“ARM处理器”,而ARM公司与芯片厂商的合作则存在3种形式:

原生Cortex-A系列架构

ARM公司平均每年都会推出全新的“原生”(公版)架构,包括性能级的Cortex-A7x,以及效能级的Cortex-A5x,前者可以作为CPU中的“大核”,目前SoC正好处于Cortex-A76向Cortex-A77之间的过渡阶段,2020年中旬ARM还将祭出Cortex-A78架构。

Cortex-A架构版本越高,性能越强

后者则属于CPU中的“小核”,Cortex-A73或更早期的大核都会与Cortex-A53搭配,从Cortex-A75开始则与Cortex-A55“联姻”,短期内ARM还没有更新效能级核心架构的计划。

基于Cortex的半定制化架构

芯片商在拿到ARM原生Cortex-A的架构后,可以对其进行一定程度的改造,从而实现更高性能、更多功能或更低功耗。

高通旗下的骁龙SoC总会采用名为“Kryo”的核心架构,而它们就都是基于原生Cortex-A架构半定制化而来,业内人士还习惯将这种形式称为“魔改”。

华为从麒麟980开始,包括最新推出的麒麟820,也是主打Cortex-ABased,理论上也是一种半定制化的魔改。

基于指令集的自研架构

如果芯片商只凭借ARM的指令集授权,并在此基础上研发芯片,则可被归类到“自研”架构。

比如骁龙820采用的Kryo核心、三星猫鼬(Mongoose)核心、苹果从A5往后的SoC就都采用了在ARM指令集基础上的自研CPU架构。

从ARM授权的成本角度来看,采用原生架构的授权费用最低,魔改次之,基于指令集的授权最高,而且芯片商想在ARM指令集基础上加以定制优化以形成自己独特的设计,还需要强大的研发实力,所以目前只有苹果、高通和三星有所涉猎。

从性能的角度来看,不同时期的架构之间则存在明显的性能压制,比如Cortex-A77天生就比Cortex-A76更强,但同一时期的原生、魔改和自研架构之间的差异其实并不大,主要还是受制于核心数量、多丛集和最高主频方面的影响。

多丛集设计

我们都知道Cortex-A7x性能比Cortex-A5x更强,为什么没有SoC采用全部由Cortex-A7x打造的多核处理器?

答案很简单,高性能的背后就是高功耗,为了让智能手机可以具备至少一天一充的续航底线,手机SoC必然要采取“大小核”(Cortex-A73之前称Big.Little,Cortex-A75之后为DynamIQ Big.Little)的搭配策略。

从Cortex-A75开始,DynamIQ技术可以实现更灵活的核心搭配

为了更好地权衡性能和功耗,手机SoC在“大小核”的基础上还引入了“多丛集”的概念,比如联发科天玑1000就是了“4+4”双丛集的代表,由4×Cortex-A77和4×Cortex-A55共计8个CPU核心构成。

麒麟990和骁龙865都是三丛集代表,差异是前者采用了“2+2+4”(2×A76+2×A76+4×A55),后者则是“1+3+4”(1×Kryo 585+3×Kryo 585+4×Kryo 585),即大核+中核+小核三种核心搭配的策略。

在不考虑功耗的前提下,自然是大核架构越先进,数量越多性能越强。

骁龙865的三丛集设计

但是,现实中SoC在全速运行(玩游戏)时CPU非常容易因过热而触发降频机制,从而导致性能骤降引起卡顿问题。

因此,“2+6”的双丛集和“1+3+4”或“2+2+4”的三丛集设计正逐渐成为主流。

运行频率

CPU的性能强弱,除了受制于核心架构和多丛集设计,运行频率的影响总是更加立竿见影。

我们都知道Cortex-A77架构比Cortex-A76架构强,但2019底才刚刚量产的联发科1000L(大核为Cortex-A77)的CPU性能却还不如2018年底上市的麒麟980(大核为Cortex-A76)。

原因很简单,联发科1000L的大核主频只有2.2GHz,而麒麟980的主频则高达2.6GHz,更高的主频足以弥补核心架构和大核数量上的劣势。

相同SoC的手机之间,散热设计越好的手机性能往往也是最强的

因此,对于同期同级别的SoC而言,谁的CPU主频更高,往往更容易取得性能上优势。当然,前提是手机自身的散热设计必须过硬,可以让CPU长时间运行在预设的最高主频上。

*****GPU:游戏引擎*****

GPU是SoC中重要性仅次于CPU的单元,我们可以将它理解为PC上的独立显卡,一款手机能支持多高的分辨率、刷新率、玩游戏能跑出多少帧数,几乎都需要看GPU的脸色。

GPU品牌

和SoC中的CPU单元由ARM一家独大不同,其集成的GPU单元还未江湖一统,在Android手机领域正处于“三国争霸”的格局——高通旗下的骁龙SoC全部集成自家Adreno品牌的GPU,华为/三星旗下的SoC则青睐ARM公司推出的Mali品牌GPU,联发科则经常“脚踏两只船”,ARM Mali GPU和Imagination公司的PowerVR GPU都有所涉猎。

据悉,三星已经携手AMD,在未来Exynos SoC很可能会集成由AMD授权的RDNA架构GPU,而华为也正在开展自研GPU的项目。

核心架构

和ARM CPU架构总在不断升级一样,各个品牌的GPU每隔1年~2年也会完成一次迭代。

其中,高通AdrenoGPU刚刚完成了Adreno500向Adreno600的全面升级,从定位中低端的骁龙665(Adreno 610)到最新的顶级旗舰骁龙865(Adreno 650),Adreno 6x0中的“x”数字越大代表性能越强。

ARM Mali品牌的高端GPU正经历由Mali-G76(与Cortex-A76 CPU搭配)向Mali-G77(与Cortex-A77 CPU搭配)过渡,而中端GPU很快也要从Mali-G52升级到Mali-G53。

ARM Mali GPU的发展路线

在大的方向上,Mali-G7x肯定强过Mali-G5x,并同样是“x”数字越大代表性能越强。ImaginationGPU很快也要从第九代(PowerVR 9)过渡到第十代(PowerVR IMG A),考虑到该系列GPU比较小众,我们就不在本文赘述了。

如果你想了解更多手机GPU的历史和相关技术,请参考《手机处理器的GPU谁最强?看完这篇文章你就懂了!》这篇文章。

计算单元

在现实中,很多GPU都采用相同架构的核心,但它们的GPU性能却存在很大的差异。

比如,骁龙675(Adreno612)和骁龙730(Adreno618)集成的都是Adreno61x系列GPU,麒麟990和Exynos 980集成的也都是Mali-G76 GPU,但它们两两之间的3D性能却不可同日而语。

DIY用户都知道,PC领域的独立显卡会根据不同数量的“流处理器”来划分档次。

手机SoC内的GPU也是如此,只是这里的“流处理器”叫法不同,高通AdrenoGPU称做“ALUs”,ARM Mali GPU则叫“Shader Core”,我们习惯将它们统称为“计算单元”。

还是以麒麟990和Exynos 980为例,前者为Mali-G76 GPU搭配了16个计算单元,即Mali-G76MP16,而后者的计算单元数量只有5个,即Mali-G76MP5,所以麒麟990的3D性能至少2倍~3倍于Exynos 980。

图形接口

在3D游戏的开发中,API图形接口越先进,GPU的执行效率越高。

如果手机GPU恰好支持这种API,就能最大限度避免“负优化”,还有机会实现“越级挑战”。

手机SoC GPU所支持的API主要以OpenCL、OpenGL、Vulkan和DirectX为主,目前它们最新的版本分别为OpenCL2.0FP、OpenGLES3.2、Vulkan1.1和DX12,很多最新的GPU加入了多神经网络加速器的优化,可配合NPU单元进一步加速AI运算。

从2018年底开始很多中端手机玩《王者荣耀》也能启动60FPS模式并比同时期的旗舰级还要流畅,就是因为该游戏推出了VulkanAPI的优化版,可以进一步释放新款GPU的全部潜力。

运行频率

和CPU一样,GPU的强弱除了架构之外,也受到运行频率的牵制。联发科Helio G90、骁龙730和骁龙765是最具代表性的SoC,它们都存在一个后缀带“G”的型号,通过提升CPU和GPU的频率获得了更强的性能(表2)。

如果你只关注绝对性能,看到这里就能告一段落了。

当我们看到一款陌生的SoC时,可以先看制程工艺,如果它能采用7nm或7nm+EUV就代表它具备更加节能省电的特性。

然后看CPU架构和主频,Cortex-A77和Kryo 500核心代表着当前架构的最强音,当CPU主频高于2.6GHz那它就具备旗舰级的CPU性能,如果低于2.4GHz就是中等偏上。

如果你喜欢玩游戏,就需要看它的GPU是Mali-G7x还是Mali-G5x,并数一下计算单元的数量,多多益善。

然而,手机并不仅限于跑分和玩游戏,在追求更强性能之余,它在日常应用环境下的表现,往往要比绝对的性能更加重要。比如,基带、DSP、ISP等单元,如果你对它们的作用感兴趣,请关注CFan的后续报道。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10816

    浏览量

    210973
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4685

    浏览量

    128647
  • soc
    soc
    +关注

    关注

    38

    文章

    4113

    浏览量

    217845
  • 指令集
    +关注

    关注

    0

    文章

    221

    浏览量

    23354
  • 骁龙865
    +关注

    关注

    0

    文章

    174

    浏览量

    12447
收藏 人收藏

    评论

    相关推荐

    简单认识第二代高通Oryon CPU

    在不久前的2024峰会上,备受瞩目的新一代旗舰移动平台——8至尊版正式发布。这款以“
    的头像 发表于 11-13 09:43 136次阅读

    8至尊版性能实测:自研Oryon CPU实现45%性能与能效提升

    现在高通新一代旗舰移动平台——8至尊版(8 Elite)已经发布,作为首款集成高通定制Oryon CPU的旗舰移动平台,其
    的头像 发表于 10-25 10:01 422次阅读
    <b class='flag-5'>骁</b><b class='flag-5'>龙</b>8至尊版性能实测:自研Oryon <b class='flag-5'>CPU</b>实现45%性能与能效提升

    峰会亮点:自研Oryon CPU首次同时登陆手机、汽车

    10月22日,高通举行了2024峰会,正式推出了全新旗舰移动平台——8至尊版。 不只是全新命名那么简单,
    的头像 发表于 10-25 09:55 175次阅读
    <b class='flag-5'>骁</b><b class='flag-5'>龙</b>峰会亮点:自研Oryon <b class='flag-5'>CPU</b>首次同时登陆手机、汽车

    8至尊版发布,自研第二代Oryon CPU登陆手机

    北京时间10月22日凌晨,2024峰会上,高通正式发布新一代旗舰移动平台——8至尊版
    的头像 发表于 10-24 18:22 307次阅读
    <b class='flag-5'>骁</b><b class='flag-5'>龙</b>8至尊版发布,自研第二代Oryon <b class='flag-5'>CPU</b>登陆手机

    高通汽车新方案:CPU性能跃升3倍,AI性能狂飙12倍

    。   据了解,座舱至尊版平台作为8295的升级版,被命名为Elite。该平台搭载了高通专为汽车行业设计的自研Oryon CPU
    的头像 发表于 10-23 14:50 487次阅读

    高通推出8至尊版,集成全球最快的移动端CPU

    10月21日,在美国夏威夷高通峰会期间,高通技术公司推出了8至尊版移动平台,这是迄今为止高通最强大且全球速度最快的移动端系统级芯片。
    的头像 发表于 10-22 14:40 1350次阅读
    高通推出<b class='flag-5'>骁</b><b class='flag-5'>龙</b>8至尊版,集成全球最快的移动端<b class='flag-5'>CPU</b>

    高通X Elite平台:AI能力引领未来,预训练模型助力开发者

    上,而对传统的CPUGPU的介绍则显得相对简洁。这一策略背后,是高通对于未来计算领域发展趋势的深刻洞察和对AI技术的坚定信心。
    的头像 发表于 06-24 17:08 611次阅读

    小天才Z10旗舰新品发布,搭载W5可穿戴平台

    作为小天才本年度的顶级产品,Z10 的核心技术是先进的 W5 可穿戴平台。该平台采用行业领先的 4 纳米制程工艺,配备 Cortex-A53 CPU 与 Adreno 702
    的头像 发表于 05-24 17:50 2116次阅读

    高通推出全新X Plus平台

    近日,高通技术公司推出了全新的®X Plus平台,进一步拓展了其领先的X系列产品组合。这款平台采用了前沿的高通Oryon™
    的头像 发表于 05-06 14:18 422次阅读

    AI服务器异构计算深度解读

    AI服务器按芯片类型可分为CPU+GPUCPU+FPGA、CPU+ASIC等组合形式,CPU+GPU是目前国内的主要选择(占比91.9%)。
    发表于 04-12 12:27 556次阅读
    AI服务器异构计算深度解读

    高通重磅发布第三代7+,引领AI与性能新纪元

    近日,科技界掀起一阵狂潮,高通技术公司盛大发布第三代7+移动平台,此举不仅将终端侧生成式AI技术首次引入
    的头像 发表于 03-25 09:46 1345次阅读

    X Elite芯片在Geekbench亮相,性能领先苹果M2 Max

    回顾2023年高通峰会,高通首次发布专为PC设计的新一代X性能平台,其中最高端版本定名“X Elite”。
    的头像 发表于 02-25 15:05 656次阅读

    gpu是什么和cpu的区别

    GPUCPU是两种常见的计算机处理器,它们在结构和功能上有很大的区别。在这篇文章中,我们将探讨GPUCPU的区别,并详细介绍它们的原理、应用领域和性能特点。 一、概述 1.1
    的头像 发表于 02-20 11:24 1.8w次阅读

    为什么GPUCPU更快?

    GPUCPU更快的原因并行处理能力:GPU可以同时处理多个任务和数据,而CPU通常只能一次处理一项任务。这是因为GPU的架构使得它可以同时
    的头像 发表于 01-26 08:30 2205次阅读
    为什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?

    CPUGPU之间的主要区别

    以下是以表格形式提供的CPUGPU之间的一些区别:中央处理器图形处理器CPU代表中央处理器。GPU代表图形处理单元。CPU是通用处理器。
    的头像 发表于 12-14 08:28 745次阅读
    <b class='flag-5'>CPU</b>和<b class='flag-5'>GPU</b>之间的主要区别