0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

详解3NX-NNA,升级5大核心带来哪些改变?

cMdW_icsmart 来源:lq 2018-12-22 16:15 次阅读

总结一下,此次发布会Imagination发布了针对AI和视觉的神经网络硬件加速器PowerVR 3NX NNA;同时还发布了三款新品GPU,分别是PowerVR 9XEP、9XMP、9XTP,基本上从低端到高端应用需求全覆盖。

详解3NX-NNA,升级5大核心带来哪些改变?

2018年可以说是AI芯片的爆发之年,以手机市场为例,芯片厂商对于AI能力的宣传力度已经逐渐超过了传统的CPU和GPU性能。不少业内专家认为,在手机性能过剩的当下,未来手机芯片的竞争焦点将是AI功能。

目前包括高通、华为、联发科、紫光展锐在内的手机芯片公司纷纷押宝AI功能,并在手机SOC中加入神经网络计算的硬件加速器。业界最大的两大知识产权(IP)供应商ARM和Imagination自然也不会缺席。

ARM此前就发布了其第一代机器学习处理器架构“Trillium”,将DeePhi神经网络压缩技术、FPGA的可编程性,以及DSP的低功耗处理能力聚合在一起。

而Imagination则在2017年就发布了全球第一款神经网络加速器PowerVR®2NX NNA(简称2NX),这是一个专门做人工智能硬件加速的IP。作为独立的神经网络加速器,2NX不需要跟CPU、GPU绑定,既可以辅助加速,也可以独立存在。

Imagination产品部资深总监Neal Forse透露,去年2NX发布后在业界反映非常好,目前已经有两家中国手机厂商签约采用这款IP。

从左到右依次为:

Kristof Beets, Imagination Technologies PowerVR产品管理和技术营销高级总监

Neal Forse,Imagination Technologies视觉和人工智能产品管理高级总监

David McBrien,Imagination Technologies销售和市场营销执行副总裁

刘国军(James Liu), Imagination Technologies副总裁兼中国区总经理

Graham Deacon,Imagination Technologies PowerVR图形处理商务运营副总裁

2018年12月4日,Imagination在深圳举行了一年一度的技术交流会。在此次交流会上,Imagination推出了几款具有新特性的IP,其中就包括基于2NX基础升级的PowerVR®3NX NNA(简称3NX)。以及三款新的GPU系列,包括PowerVR®9XEP、9XMP、9XTP。

据介绍,3NX主要针对四大应用市场,包括移动计算(手机、平板),智能安防,消费电子,汽车自动驾驶。其中自动驾驶将是3NX接下来发展的重点市场。

3NXAX3595的多核演进图

相比2NX,3NX有哪些性能上的提升呢?笔者总结了几点:

第一,IP核心数增加。相比2NX的AX2145和AX2185,3NX增加到了5个核,这带来了强大的性能提升。

这5个核心包括AX3145、AX3385、AX3365、AX3595以及一个低端核。其中AX3145的单核算力达到1.2TOPS,AX3385为5 TOPS,AX3365为2.4 TOPS,AX3595为10 TOPS,最低端核为0.6TOPS。

3NX在PPA上的提升

如同CPU、GPU的多核方式,3NX支持多核方式,多核方式带来的好处非常多。首先是性能上,通过多核方式,3NX最高可达到160TOPS的算力,如此高的算力将在汽车等高端应用上产生作用。

“和上一代相比,性能提升了70%,效率提升了40%。功耗降低了40%,带宽降低了35%。”Imagination Technologies视觉和人工智能产品管理高级总监Neal Forse表示,之所以能做到这一点,主要是因为采用了新的无损压缩算法

3NX-F 可编程的扩展性

3NX系列另外一个关键特性是可编程的拓展性,因此这里叫3NX-F,F代表灵活性。通过增加可编程的扩展性来优化硬件,这样做的目的是让客户实现差异化设计。比如可以让客户不断加入新的技术,如神经网络等,还可以构建一个Open CL的内核。

除了高性能之外,也别忘记了3NX还有一颗低端的0.6TOPS核,这颗核心使得3NX可以实现低功耗的物联网应用。对于一些对功耗和成本比较低的应用,如简单的人脸识别等。还有一些你可能想不到的应用,比如在国外有用3NX来检测街上的流浪汉,避免在冬天这些人被冻死。Neal Forse表示,对于帧率要求较低的IOT市场,以及低功耗、广域网的应用,功耗可以做到非常低,可以实现毫瓦级别的功耗。

作为独立的神经网络加速器,NNA也常被人拿来和寒武纪、地平线等提供XPU的算法公司进行比较。Neal Forse对此没有正面回应,只是表示“我们喜欢这样的竞争”。他同时认为,每家AI厂商的起点都不一样,竞争对手可能用可编程的架构、DSP做神经网络的方案,再加上指令集。而imagination的做法是通过计算优化的方案,看如何通过最优的计算引擎来把神经网络映射到硬件上。“我们的优化是来自线下的编译,而不是在线的执行。”

9X EP、9XMP、9XTP,不管玩什么游戏,总有一款GPU适合你

PowerVR®9XE9XM 9XT

前面说了这么多关于人工智能的新IP介绍,但不管怎么说Imagination毕竟以前专门给苹果提供GPU,GPU还是其主打的拳头产品。Imagination的GPU产品线包括PowerVR®XM、XE和XT系列,相比其他竞争对手,PowerVR®系列最大的优势是性能高、功耗低。

PowerVR®9XE9XM 9XT主要特性

2017年,Imagination推出了两款PowerVR®GPU产品Series 9XM与9XE,为价格低廉的产品也带来了绝佳的图像体验。此次新品发布会上,Imagination PowerVR®业务部副总裁 Graham Deacon介绍了三款新IP,包括PowerVR®9XEP、9XMP、9XTP,分别对应不同市场。

9XEP主要关注在低端手机以及数字电视市场,为硬件设备上的GUI以及HMI提供最佳体验,包括休闲游戏等应用。其特点是可在最小面积上提供最高的填充率。9XEP可以达到每个时钟1-8个像素填充率, 每个时钟16-64个FP32 OPS。

采用前代PowerVR®技术的数码相框产品

这个行业更看重用户界面而非游戏性能,要求更高的分辨率。另外数字电视也越来越多采用神经网络来进行语音识别、面部识别、安全特性等应用。机顶盒市场比较看重成本,预计整机价格在40~50美金左右,对于SOC的成本要求很高。

采用前代PowerVR®技术的车载中控产品

此外,9XEP还可以广泛应用于车载中控系统。现在高端汽车可能有5~6个显示屏,除了车载显示屏,在抬头显示、电子后视镜等领域都将开始采用显示屏。

采用前代PowerVR®技术的面部识别demo

以汽车中常见的应用为例,比如“车道偏离警示”大概需要10个GFLOPs,低性能GPU可以支持这样的性能要求;但是“行人预测”就需要很宽的性能要求,至少需要100个GFLOPS,这些都对GPU提出了更高要求。

▲图为采用9XMP与三星S9+以及华为Mate10 Pro游戏画面的对比,可以看到细节和对比度的差异

9XMP主要是关注游戏以及中端手机市场。其特性是在最低的面积有最好的计算能力,同时还保证成本。主要是关注游戏的性能密度和加了相关的特殊特性,它的处理数量是每时钟4-8个像素,128-256 FP32 Ops。和上一代相比,9XMP在性能密度方面提升了45%,通过增加性能密度的方式改善游戏性能,同时加入专用的纹理缓存以及视觉无损压缩技术(PowerVR®PVRIC4),确保带宽降低50%。

▲图为9XEP、9XMP、9XTP的画面细节对比

▲PowerVR®PVRIC4第四代视觉无损压缩技术

9XTP可以说是这次发布的旗舰型产品,主要关注最高端的游戏体验。9XTP每时钟可以超过192FP32 Ops,架构可扩展,可以在最低的面积实现更好的算力。

9XTP聚焦于高功效和高性能,有50%配置方面的改进。9XTP同时采用PVRIC4的压缩技术,可实现视觉无损压缩,可以保证内存的带宽降低50%。

9XEP和9XMP IP Core主要采用PowerVR®Rogue架构,这个架构在2010年推出,已经非常成熟和成功。

GPU需求和市场趋势

Imagination PowerVR®业务部副总裁 Graham Deacon认为,除了高端的GPU,其实客户对于低成本的嵌入式GPU需求量也很大。需要更高的性能和特性,但是要求系统成本更低,因此必须提供高密度、低带宽、低功耗、低SOC芯片面积的产品。Imagination的一大优势是可根据客户需求来定制GPU,同时提供更好的灵活性、可扩展性等差异化因素。

AI没想象中强大,GPU+AI更适合提升系统能力

值得一提的是,对于AI硬件加速器的需求增加,是否会对GPU的需求降低呢?Imagination如何在两种IP之间取得平衡?

对于这个话题,Neal Forse认为这两者是互补的,这也是为什么Imagination在发布GPU的同时也发布NNA。

比如一些低端的产品可能只需要通过GPU来进行一部分AI的计算,而一些高端的产品则采用专门的硬件加速器来做处理。

Neal Forse表示,在发展AI运算的过程中,异构性一直是Imagination拥抱的策略。他认为目前深度学习算法存在很大问题,只是做简单的感测识别,无法进行进一步的推理。未来神经网络的性能评价标准将不一定是计算效率的提升,而是机器学习效率的提升。

此外,传感器融合也是未来人工智能的一个发展方向。未来可能每个传感器都会对应一个NNA的引擎,再加上AI数据分析。这样可以大大降低终端的数据处理压力,进一步提升计算结果。

人工智能的未来将如何发展?其实从目前来看业界对于人工智能的关注度过高,但其实AI并没有预想中的那么强大。真正的强人工智能——机器拥有意识,并能够基于认知推理作出决策其实现在业界根本还没摸到边,并且未来技术发展有赖于5G通信技术的普及。

那么现在的弱人工智能,其实最大的用处是进一步用来增强系统的能力,而非将其作为有一个核心卖点。在现有的芯片封装密度下如何让其获得机器学习的能力?Imagination给出的方案显得比较靠谱,那就是同时提供高性能的GPU和神经网络加速器。

通过GPU来处理AI应用中的可视化操作,比如图像识别和排序、手势识别驱动接口以及实时视频分析等。而神经网络加速器NNA则用来为高级推理和边缘数据处理提供硬件加速。如此一来,客户可以根据自己的需求各取所需。

汽车行业“老司机”,Imagination能否对标Nvidia?

总结一下,此次发布会Imagination发布了针对AI和视觉的神经网络硬件加速器PowerVR 3NX NNA;同时还发布了三款新品GPU,分别是PowerVR 9XEP、9XMP、9XTP,基本上从低端到高端应用需求全覆盖。

另外,作为苹果曾经的GPU供应商,Imagination在手机移动领域的市场地位非常高,目前采用Imagination相关IP的手机客户每年发布上亿颗芯片,可以说与ARM和高通三分天下。

不过随着手机市场近些年的下滑趋势,Imagination也在积极开拓新的市场,比如汽车市场。

Imagination Technologies销售和市场营销执行副总裁David McBrien表示,Imagination多年来一直在为汽车行业提供各种IP模块,其实Imagination和TI瑞萨等合作伙伴在汽车仪表盘领域已经占据50%的市场份额。

2018年PowerVR®的汽车硬件产品之一是PowerVR®8XT-A GPU,它支持SoC设计人员所需的增强恢复和可靠性功能,以获得针对数字人机界面(HMI)和自动驾驶汽车的处理器的汽车安全认证(AVS)。Imagination打算通过量身定制的解决方案继续扩展其PowerVR®汽车硬件IP产品组合,除了明年会推出另一款汽车级GPU IP之外,还将提供支持ASIL的NNA,而这又可以与PowerVR®8XT-A GPU和其他处理模块混合搭配。

除此之外,Imagination还宣布推出PowerVR®Automotive完整产品套装,以促进汽车半导体行业的增长和加速。PowerVR®Automotive结合了硬件知识产权(IP)、软件、工具、文档和长期支持五大基本要素,随着汽车行业迈向全自动驾驶,其可支持市场中的现有客户和新进入者以满足行业的安全标准和性能要求。

很明显,Imagination未来在汽车领域对标的是Nvidia,其未来目标是将GPU和NNA放入更多tear 1的汽车供应商采购列表中。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10811

    浏览量

    210878
  • 神经网络
    +关注

    关注

    42

    文章

    4749

    浏览量

    100433
  • 机器学习
    +关注

    关注

    66

    文章

    8356

    浏览量

    132324

原文标题:弱AI时代,为什么Imagination的“GPU+NNA”方案更靠谱?

文章出处:【微信号:icsmart,微信公众号:芯智讯】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    3D堆叠像素探测器芯片技术详解(72页PPT)

    3D堆叠像素探测器芯片技术详解
    的头像 发表于 11-01 11:08 2316次阅读
    <b class='flag-5'>3</b>D堆叠像素探测器芯片技术<b class='flag-5'>详解</b>(72页PPT)

    梦网科技与智谱AI携手升级5G阅信应用

    近日,梦网科技与智谱AI再度携手,共同推动5G阅信应用的全面升级。此次升级不仅引入了多项前沿技术,更为企业用户带来了前所未有的便捷与效率。
    的头像 发表于 10-31 10:38 233次阅读

    华为WATCH GT 5系列智能手表亮相,Petal Maps 手表地图再升级

    9月24日,在华为秋季全场景新品发布会上,华为正式发布了备受期待的HUAWEI WATCH GT 5系列智能手表,首发搭载玄玑感知系统、向日葵定位系统,并基于Petal Maps能力升级带来全新
    的头像 发表于 09-25 11:11 381次阅读

    莱迪思MachXO5D-NX FPGA的性能

    从行业第一颗安全控制FPGA芯片MachXO3D和具备“高端加密功能”的安全控制FPGA Mach-NX,到“增强型安全控制FPGA”MachXO5-NX,再到最新推出的MachXO5D-NX
    的头像 发表于 09-02 09:29 306次阅读

    Nextorage发布高性能NX-PS1PRO系列移动固态硬盘

    8月22日最新消息,日本知名存储品牌Nextorage于本月19日正式推出了其全新力作——NX-PS1PRO系列移动固态硬盘。这款产品以创新的盒线分离设计及强大的USB4 40Gbps接口为亮点,无需额外电源供应,为用户带来了前所未有的便捷与高速体验。
    的头像 发表于 08-22 15:15 531次阅读

    288芯MPO光纤配线架 万兆高密度OM3OM4配置详解

    288芯MPO光纤配线架 万兆高密度OM3OM4配置详解
    的头像 发表于 07-30 09:53 432次阅读
    288芯MPO光纤配线架 万兆高密度OM<b class='flag-5'>3</b>OM4配置<b class='flag-5'>详解</b>

    亚马逊云科技升级3+1”合作伙伴战略

    亚马逊云科技近期于上海召开了盛大的中国合作伙伴峰会。在这次会议上,亚马逊云科技正式宣布推出升级版的“3+1”合作伙伴战略,旨在通过聚焦生成式AI、专注行业和业务拓展三大核心领域,以及提供全方位的赋能支持,持续推动合作伙伴的创新和
    的头像 发表于 06-06 10:50 642次阅读

    STM8S105使用ADC1通道3,5,为什么通道3会随通道5改变呢?

    基于 STM8MC-KIT v1.0 库; 问题:使用ADC1通道3,5,测试发现通道5使用正常,通道3随通道5电压改变,示波器测量通道
    发表于 05-13 07:19

    人形机器人主板:jetson orin nx核心模块与SOM-7583核心模块结合在一块主板上

    ERUN_7583_ORIN_NX嵌入式人工智能计算机底板,专为满足人形机器人的实际需求而设计,他具备jetson orin nx核心模块与SOM-7583核心模块,可以实现
    的头像 发表于 03-26 11:17 753次阅读
    人形机器人主板:jetson orin <b class='flag-5'>nx</b><b class='flag-5'>核心</b>模块与SOM-7583<b class='flag-5'>核心</b>模块结合在一块主板上

    贸泽开售Laird Connectivity Sera NX040 UWB+BLE模块 可用于IoT和工业应用

    2024 年 3 月 14 日 – 专注于引入新品的全球电子元器件和工业自动化产品授权代理商贸泽电子 (Mouser Electronics) 即日起开售Laird Connectivity
    发表于 03-15 17:26 225次阅读

    Ooredoo携手华为升级5G核心网,为5.5G时代做准备

    近日,全球领先的通信运营商 Ooredoo 集团宣布与华为达成合作协议,共同为在卡塔尔、科威特、阿曼、伊拉克、突尼斯、阿尔及利亚和马尔代夫等关键市场的核心网络进行现代化升级
    的头像 发表于 03-14 10:54 464次阅读

    基于M3核心板的7寸串口屏:为气体检测设备带来全新交互体验

    M3核心板应用启明智显M3芯片,凭借其国产自主高算力RISC-V内核以及平头哥单核E907架构,为工业气体检测解决方案提供了强大的硬件支持。特别是当M3
    的头像 发表于 03-13 18:03 641次阅读
    基于M<b class='flag-5'>3</b><b class='flag-5'>核心</b>板的7寸串口屏:为气体检测设备<b class='flag-5'>带来</b>全新交互体验

    苹果M3芯片有几个核心

    M3芯片的具体核心数取决于其型号和配置。一般而言,基础的M3芯片配备有8个核心,包括一定数量的性能核心和能效
    的头像 发表于 03-08 16:52 907次阅读

    DDR1/2/3数据预取技术原理详解

    时钟频率:可通过倍频技术升级核心频率。时钟频率可以理解为IO Buffer的实际工作频率,DDR2中时钟频率为核心频率的2倍,DDR3 DDR4中时钟频率为
    的头像 发表于 12-25 18:18 4318次阅读
    DDR1/2/<b class='flag-5'>3</b>数据预取技术原理<b class='flag-5'>详解</b>

    嵌入式Linux应用程序开发详解-第3

    电子发烧友网站提供《嵌入式Linux应用程序开发详解-第3章.pdf》资料免费下载
    发表于 11-16 11:19 0次下载
    嵌入式Linux应用程序开发<b class='flag-5'>详解</b>-第<b class='flag-5'>3</b>章