华为移动AI芯片麒麟970的GPU技术创新-电子发烧友网

今日，Arm生态系统合作伙伴华为于北京召开发布会，正式在国内发布搭载10nm工艺制程的年度旗舰处理器麒麟970，同时也是全球首款内置神经元网络单元（NPU）的智能芯片。

在核心配置方面，麒麟970采用了4*Cortex-A73+4*Cortex-A53的大小核设计，其中A73大核主频为2.4GHz，A53小核主频为1.8GHz。在GPU上，麒麟970为Mali-G72 MP12，在视频方面首次支持HDR10，支持4K@60fps视频解码。相机双ISP，支持人工智能场景识别、人脸追焦、智能运动场景检测，夜拍效果得到加强。

作为Arm今年新发的高端GPU，Mali-G72已“装机”麒麟970，它有哪些强大之处？它又是如何对人工智能与机器学习算法进行支持的呢？

机器学习与GPU技术的完美Match

人工智能的最近一次浪潮起源于 2011 年前后深度学习（Deep Learning）引起的大发展。在其背后，快速发展的 GPU 功不可没。机器学习作为人工智能领域的一个小分支，如今已是移动计算的关键应用场景之一。通常而言，机器学习在云端上进行，运用训练神经网络的大量数据集实现智能连接，但越来越多的数据也需要在设备端进行，比如像翻译这样的简单任务，通过云端持续传送大量数据，不但增加成本，而且速度也很慢，这也是为何业界开始研究“将机器学习界面放到设备本身”的原因。

搭载了Mali-G71的华为Mate 9便是一次不错的尝试，它其中的机器学习算法会找出你最常用的应用程序，并对其能耗性能进行优先设置，保证实现最优性能，其中，基于Bifrost架构的Mali-G71功不可没，而Mali-G72性能则更优。相比Mali-G71，Mali-G72性能提升了40%、能效提升25%、每平方毫米的芯片面积效能提升20%，并针对机器学习进行了优化，为机器学习效率带来17%的提升，从而使得Arm能够在整个SoC上更高效地现实分布式智能。期待搭载Mali-G72的新机华为Mate 10的上市。

为何Mali-G72这么牛？除了继续保持Bifrost架构最主要的高效能特色外，像是CPU与GPU彼此间完整的系统一致性、索引式定位着色器等，Mali-G72同时还有多项新武器。Arm增加了区块缓冲存储器(tile buffer memory)，以便让GPU在每个运行区块(tile)支持更多的储存空间，也重新平衡了执行引擎的数据路径，移除某些鲜少使用的指令，并以更简单的指令顺序取而代之。同时，Arm针对更多复杂运算进行了优化，为了进一步降低带宽，增加了一级缓存与写回缓存的大小，同时也改变指令缓存逻辑，以便在不增加整体面积与耗电情况下进行更佳利用，并减少对复杂内容产生的缓存遗漏情况。综上，Mali-G72算法优化及增加的高速缓存已经非常成熟，借由此大幅降低带宽，可以实现机器学习最大的效率与效能。

Arm GPU架构使用发展史

2007年Arm推出基于Utgard架构的Mali-200，当时面向的设备分辨率较低，内容比较简单。Utgard架构的特点是并非像现代GPU设计那样采用了统一渲染引擎，它依旧是一个典型的顶点和像素分离式渲染的产物。

2010年末，Arm推出基于Midgard架构构建的首款GPU Mali-T604，面向的设备可达1080p HD的分辨率，内容变得越来越复杂了。从架构上来看，Midgard是之前Utgard的继承者，但是统一渲染架构和分离式渲染架构的差异如此之大，使得这两个架构又不能直接比较。当然，Midgard还是继承了不少Utgard中优秀的部分，尤其是部分周围功能模块。

2016年，随着内容变得越来越精细，越来越复杂，在GPU渲染的角度来说会有更复杂光影的处理，包括全局光照的处理。从显示面板的角度来看，未来4K的面板也会大量涌现。为满足这样的市场需求，Arm推出了基于崭新GPU架构Bifrost的产品。虽然Bifrost架构看上去与Midgard类似，但其内部的功能模块均有显著的提升，基于前面提到的各种各样的应用场景，包括设备的需求，以及面对的挑战，Bifrost架构都可以解决这样的问题。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
4829

浏览量
129768
AI

AI

+关注

关注
87

文章
32408

浏览量
271562
Huawei

Huawei

+关注

关注
1

文章
177

浏览量
20316

原文标题：揭秘华为首款移动AI芯片麒麟970背后的GPU技术创新

文章出处：【微信号：arm_china，微信公众号：Arm芯闻】欢迎添加关注！文章转载请注明出处。

AI大模型技术创新，引领智能清洁新时代

近日，全球商用清洁机器人市场的领军企业——高仙机器人（Gausium），再次以其卓越的技术创新和强大的市场影响力，吸引了业界的广泛关注。

发表于 02-15 09:58 •158次阅读

云知声荣登2024数字技术创新企业TOP20榜单

近日，朋湖网联合机器人开放社区发布了“2024年度科技产业系列榜单”，云知声凭借其在AI技术创新与产业化应用领域的卓越成就，荣登 “2024数字技术创新企业TOP20”榜单。

发表于 01-23 09:11 •269次阅读

《算力芯片高性能 CPUGPUNPU 微架构分析》第3篇阅读心得：GPU革命：从图形引擎到AI加速器的蜕变

CPU、GPU的演进历程,AI专用芯片或将引领未来计算平台的新方向。正如爱因斯坦所说：\"想象力比知识更重要\" —— 在芯片设计领域,创新

发表于 11-24 17:12

华为星河AI网络共赢行业智能化

的技术创新与发展。会上，华为专家深入阐述了星河AI网络解决方案的技术创新和价值，并邀请区域客户分享智能时代网络建设的最佳实践。

发表于 11-18 11:29 •488次阅读

华为发布两大关键创新技术方向

发展趋势，深入洞察和分析应用对网络连接要求的变化，探索移动AI基础网的关键特征及其目标网演进方向。同时，面向移动AI基础网，华为发布了两大关

发表于 11-06 17:26 •878次阅读

华为AI解决方案加速超宽带产业创新

公司All Intelligence战略，提出了超宽带（UBB）和AI协同发展的产业方向，通过技术创新和商业孵化加速迈向智能世界。

发表于 11-01 15:03 •460次阅读

节能回馈式负载技术创新与发展

的创新性发展进行探讨。节能回馈式负载技术的创新主要体现在其设计理念上，传统的负载设备通常是单向消耗电能，而节能回馈式负载则是将多余的电能回馈到电网中，实现了能量的有效利用。这种设计理念的创新

发表于 10-17 09:46

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

在 GPU 中的应用历史第9章张量处理器设计 9.1 张量的定义 9.2 脉动阵列计算单元 9.3 Volta 架构引入张量核心 9.4 华为异腾Ascend910NPU芯片第 10 章

发表于 10-15 22:08

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

，推动科学研究的深入发展。总结通过阅读《AI for Science：人工智能驱动科学创新》第二章，我对AI for Science的技术支撑有了更加全面和深入的理解。我深刻认识到

发表于 10-14 09:16

名单公布！【书籍评测活动NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

和像素统一的G80到现在重金难求的H100；AMD的Zen系列CPU和RDNA系列GPU两线作战；中国的高性能计算芯片逐步获得更多TOP500排名；华为Ascend 910 NPU芯片

发表于 09-02 10:09

飞凌嵌入式技术创新日（深圳站）精彩回顾

2024年8月26日下午，飞凌嵌入式技术创新日深圳站在深圳威尼斯英迪格酒店盛大举行，此次活动汇聚了近200位嵌入式技术领域的专家和企业代表，共享嵌入式技术的盛宴，共创嵌入式技术的美好未

发表于 08-28 09:06

后摩智能与联想集团签署战略协议共同探索AI PC技术创新与应用

近日，后摩智能与联想集团宣布签署战略合作协议，双方将共同探索AI PC的技术创新与应用。根据协议约定，后摩智能将发挥其在存算一体AI芯片领域的创

发表于 07-31 17:24 •1051次阅读

平衡创新与伦理：AI时代的隐私保护和算法公平

的发展不应背离人类的伦理道德。在推动技术创新的同时，我们必须确保每一步都走得稳健和负责。通过提高透明度、保障算法公平性、保护个人隐私权以及加强国际合作，我们可以确保AI技术的健康发展，使其成为促进社会进步和增进人类福祉的力量。

发表于 07-16 15:07

湃睿科技参加华为云企业快成长技术创新峰会，推动企业数智化转型

4月20日，“释放数智新动能·华为云企业快成长技术创新峰会”在上海成功举办。本届峰会聚焦企业数智化创新技术、AI应用、数字人等议题，就如何辅助企业业务增长、护航数据安全展开讨论。

发表于 04-23 09:47 •942次阅读

罗德与施瓦茨荣获GTI Awards 2024移动技术创新突破奖

在近日举行的世界移动通信大会上，罗德与施瓦茨（R&S）凭借其卓越的R&S CMX500无线通信测试仪荣获了GTI Awards 2024移动技术创新突破奖。这一奖项旨在表彰在5G开发

发表于 03-15 10:38 •639次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

华为移动AI芯片麒麟970的GPU技术创新

评论

AI大模型技术创新，引领智能清洁新时代

云知声荣登2024数字技术创新企业TOP20榜单

《算力芯片高性能 CPUGPUNPU 微架构分析》第3篇阅读心得：GPU革命：从图形引擎到AI加速器的蜕变

华为星河AI网络共赢行业智能化

华为发布两大关键创新技术方向

华为AI解决方案加速超宽带产业创新

节能回馈式负载技术创新与发展

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

名单公布！【书籍评测活动NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

飞凌嵌入式技术创新日（深圳站）精彩回顾

后摩智能与联想集团签署战略协议共同探索AI PC技术创新与应用

平衡创新与伦理：AI时代的隐私保护和算法公平

湃睿科技参加华为云企业快成长技术创新峰会，推动企业数智化转型

罗德与施瓦茨荣获GTI Awards 2024移动技术创新突破奖