这次,苹果在自家的A11 Bionic芯片上搭载了一个专用于机器学习的硬件——“神经网络引擎(neural engine)”。
现在所谓的手机处理器,比如高通的835、苹果的A11、麒麟970等,实际上所指的是一个“处理器包”封装在一起,这个计算包专业一点说叫Soc(System-on-a-Chip),高大上的说法是“计算平台”;根据分工不同,很多专用功能的处理单元加进来,比如我们最熟悉的是GPU,现在这个包里的独立单元数量已经越来越大,比如ISP(图像处理)、Modem(通信模块)、DSP(数字信号处理)等。
不同的数据进来,交给不同特长的计算模块来处理将会得到更好的效果、更高的能效比,A11的神经网络引擎(neural engine)跟麒麟970的NPU一样,是在手机处理器平台新加入的一个擅长神经网络计算的硬件模块。
而这也是为什么从20nm、16nm、到现在的10nm、以及研发中的7nm,各大芯片设计商、代工商都在拼命把芯片技术往小了做,为的就是在不影响芯片大小的前提下挤进更多的独立处理单元。
A11的神经网络引擎采用双核设计,每秒运算次数最高可达6000亿次,相当于0.6TFlops(寒武纪NPU则是1.92TFlops,每秒可以进行19200次浮点运算),以帮助加速人工智能任务,即专门针对Face ID,Animoji和AR应用程序的ASIC(专用集成电路/全定制AI芯片)。
有了神经网络引擎,苹果高级副总裁Phil Schiller很有底气的表示:
“A11 Bionic是一款智能手机到目前为止所能拥有的最强劲、最智能的芯片。而基于ASIC的深度学习,实现了高准确率之外,还能比基于通用芯片(GPU、FPGA)的方案减少功耗。”
不过,苹果对这款神经网络引擎的功耗、实测性能等方面都没有进一步披露。
A11同时也支持Core ML,这是苹果在今年WWDC开发者大会上推出的一款新型机器学习框架,能让开发者更方便地将机器学习技术整合到自己的App中。Core ML支持所有主要的神经网络,如DNN、RNN、CNN等,开发者可以把训练完成的机器学习模型封装进App之中。
a11处理器规格
iPhone 8/8p和iPhone X都搭载了苹果自研的A11 Bionic(仿生)芯片。虽然苹果全程并没有在这款芯片上花太多功夫介绍,但我们仍旧知道它集成了一个专用于机器学习的硬件——“神经网络引擎(Neural Engine)”
可别小看了这块A11,通过智东西仔细研究发现,它不仅是iPhone X中一众“黑科技”的来源,而且苹果为了打造这块芯片早在9年前就开始了技术布局。
参数亮相,跑分爆表了
在介绍A11里专门用于机器学习的“神经网络引擎”之前,我们先来看看A11的基本参数。
工艺方面,A11采用了台积电10nm FinFET工艺,集成了43亿个晶体管(上一代采用16nm工艺的A10 Fusion集成了33亿个晶体管,华为麒麟970则用10nm工艺集成了55亿个)。
A11搭载了64位ARMv8-A架构的6核CPU,其中包括2个名为“Monsoon”的性能核(performance core)和4个名为“Mistral”的能效核(high-eggiciency core),性能核比上一代A10里的快了25%,能效核则快了70%。
而且,与A10不同,A11中使用了苹果自研的第二代新型性能控制器,允许6个CPU内核同时使用,整体性能比上一代快了70%。
至于为什么分为性能核和能效核呢?当手机进行发短信、浏览网页等轻量任务时,系统会选择调用能耗更低的能效核(high-eggiciency core),而当手机需要运行对计算能力要求更高的软件时,则需要动用性能核(performance core)进行处理,借此可以有效延长平均电池寿命。搭载了A11的iPhone X在充满电后,将会比iPhone 7延长2个小时的待机时间。
A11的另外一大亮点就是首次搭载了苹果自研的GPU,这是一款3核GPU,性能相比A10 Fusion提升30%,只需要一半的功耗就能达到A10的表现。这是今年4月苹果宣布和英国GPU设计公司Imagination Technologies“分手”后推出的首款自研GPU,针对AR、沉浸式3D游戏等方面都进行了优化,比A10快了30%。
A11里还集成了苹果自研的ISP、自研的视频编解码器等等。从种种强调的“自研”我们不难发现,苹果已经越来越强调架构的自主化。在彻底跟老朋友Imagination Technologies分手后(并且导致人家股价断崖式下跌70%后),苹果的下一个自研目标也许会移到基带技术上,与高通旷日持久的专利诉讼案件算得上是前兆了。
此外,我们也可以从A11在Geekbench的跑分上一窥究竟:在Geekbench中有A11的几个跑分,其中单核性能最高的是4274,多核性能最高的是10438,而取这些跑分平均值后,单核性能是4169,多核性能是9836。
这是什么概念呢?跟上一代A10的“单核成绩3332,多核成绩5558”比起来,A11在两方面的性能有接近30%和50%的飙升。而iPad Pro中的A10X单核性能平均在3900左右,而多核性能是9200左右,依然弱于A11。
而Android阵营的种子选手——高通骁龙835的GeekBench成绩为单核2000左右,多核6500左右。
苹果a11处理器详细参数
在介绍这款芯片之前,先让苹果用一张图带大家大概了解一下这款处理器:
翻译:
两个高性能核心(大核)
四个高效核心(小核)
第二代自研性能控制器
自研 GPU
自研 ISP(图像信号处理传感器)
自研视频编码
安全加密模块
A11 是苹果与合作多年的老伙伴 Imagination Technologies 切断关系之后的首款全自研处理器,不管是架构还是核心控制部分都由苹果独自操刀。关于这点,苹果也在发布会上作出了多次强调。根据官方的介绍,A11处理器采用了台积电最先进的 10nm 工艺制程,同时还突破性地采用了六核心的设计。其中大核性能比 A10 提升 25%,4 颗小核较 A10 提升 70%,多性能处理提升 75%。这里需要强调的是,去年的 A10 才刚从双核升级到四核,这才一年就跃升到六核了,参数党不由自主地为苹果点赞。不过这里面似乎也暗藏这两个信息,一方面可以看出苹果越来越注重性能和功耗问题了,另一方面也反映出了 iOS 目前的应用越来越复杂了,不得不强化核心。
A11包含43亿个晶体管
话虽如此,六核心的设计不但没有增加功耗,反倒更省电了。据POPPUR了解,苹果这次在处理器的调教上下了一番功夫,日常使用下是不怎么会切换到大核心的。换而言之,除了某些繁重的任务之外,手机基本都会以四核状态运行。不过这里要说明一下,苹果将这四个“小核”称为高效核心,所以性能上大家是不用担心的。此外,苹果这次自研的核心架构自主控制设计也使得电压和时脉方面有着更精密的控制,甚至有可能提前用上 ARM DynamiQ 技术,使大、小核心同样处于相同的 Cluster(簇,文件存取是以簇为单位的,若干个扇区合为一个簇) ,进而提升多核运算的效率,降低核心切换间的延迟。
A11搭载的GPU是苹果自研的三核心 GPU ,性能较 A10 性能提升 30%,而功耗则降低了 50%。换句话来说,A11 能让你获得更长游戏时间的同时提供更流畅绚丽的游戏画面。
大家可能也有留意到,这次 A11 的命名是 A11 Bionic。其中 Bionic 就是仿生的意思,所以这颗处理器其实还搭载了神经网络引擎,而这也是苹果的首次尝试。所谓神经网络引擎,实质上就是人工智能引擎,只不过苹果比较低调,没有到处宣传罢了。该引擎主要为 TureDepth 超深感相机(用于Face ID面容识别)等一系列应用 Machine Learning 机器学习算法的功能提供支持。此外在使用过程中,引擎能够通过生物辨识、影像识别、拍照、使用行为等机器学习的方式来,来提升手机的性能以及处理任务时的效率。
苹果A11处理器跑分
虽然肤浅,但跑分依然是目前为止了解处理器性能的最直观的方法。Geekbench 数据库显示,A11处理器的单核跑分为 4274 分,多核跑分也达到了 10248 分。嗯,这不止远距离抛开了A10,还直接秒了自家13英寸的 MacBook Pro.。。
苹果A11处理器跑分
苹果A10处理器跑分
而安卓阵营的王者骁龙835 的跑分是这样的。。.
骁龙835处理器跑分
评论
查看更多