0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于张量加速器性能分析和应用

lC49_半导体 来源:djl 2019-08-29 14:14 次阅读

在骁龙技术峰会第二天,高通正式公布了其新旗舰骁龙855的技术细节。

据介绍,这款使用7nm工艺打造的全新款旗舰搭载基于Arm Cortex 技术打造,拥有超过超过60亿的晶体管,在其上面,搭载了Kryo 485 CPU、自研的Adreno 640 GPU、Hexagon 690 DSP、Spectra 380 ISP和Snapdragon X24 Modem等一系列单元。需要说明一下的是,高通这个全新的SoC是全球首款支持WIFI 6的手机SoC;另外,如果想要使用5G,那就需要外挂X50 modem;为了更好地支持AI,高通在其Hexagon 690里面加入了全新的张量加速器。

下面,我们来详细看一下这款号称全球最强的旗舰。

Kryo 485:引入超级内核的概念CPU

近年来,因为手机处理的任务的多样性,这就给处理器提出了更多的新需求,这就使得之前被业界广泛接受的Big.Little架构显得有些不合时宜了,为此高通提出了一个叫做Prime Core的概念,通过“一个大核(超级内核)+三个中核(性能内核)+四个小核(效率内核)”的八核设置。按照高通的说法,这个新的架构能够很好地支持现有的任务处理,能够更好地兼顾效率与功耗。

高通Kryo 485架构

据介绍,高通基于Arm Cortex 技术打造的64bit Kryo 485 CPU,与前代旗舰平台相比,骁龙855能够带来最高达45%的性能提升。其中超级内核的的最大频率可以做到2.84Ghz,而中核的最高性能可以做到2.42Ghz,至于那个效率内核可以做到1.8Ghz。据外媒anandtech的报道,高通的这个配置同样是基于Arm Cortex A76+ Arm Cortex A55。

华为值得一提的是,早前国内发布的华为Kirin 980同样使用的是2颗Cortex A76@2.6GHz+2颗Cortex A76@1.92GHz+4颗Cortex A55@1.8GHz。单从数字上看,高通在大中小核上的最高频率表现是优于华为Kirin 980的。

Kryo 485的细节

在与竞争对手对比方面,从高通公布的几组对比来看,骁龙855是领先于竞争对手。另外高通还强调了他们的旗舰芯片在持续的表现性能上面也是首屈一指的。

骁龙855在打开一些主流APP所需的时间与竞争对手对比

Adreno 640:世界第一款支持vulkan 1.1的GPU

高通自研的Adreno GPU也是高通的杀手锏之一。

据介绍,高通在骁龙855上搭载的是新款Adreno 640 GPU。与前代相比,Adreno 640带来20%的图形渲染速度提升,同时还能继续保持业界领先水平的每瓦特能效。另外,高通方面表示,Adreno图形所支持的Vulkan 1.1、高动态范围(HDR)和基于物理渲染(PBR)将带来全新水平的逼真游戏体验。这也是业界首次在移动SoC上支持Vulkan 1.1。

高通Andreno 640的细节

根据之前的介绍,Vulkan 1.1的新功能包括子集操作,实现了多任务在一个GPU上同时运行时高效的数据共享和操作。Vulkan 1.1还实现应用可以通过他们无法获取或复制的源完成渲染和显示操作,用于受保护的多媒体内容的安全回放和显示。当然Vulkan 1.0中的扩展也得到了保留,包括多图片查看同步渲染,多个GPU在一个单独系统内使用,普遍用于例如虚拟现实的广泛引用中的高级渲染和编辑操作程序跨流程API交互操作。这些核心功能还包括16位内存获取高级计算,HLSL内存分布支持,视频流的显示,处理和编程,通过许多视频编辑解码器生成的YCbcRr颜色格式化纹理的直接抽样。

高通方面也表示,骁龙640能够支持HDR游戏(10位色深、Rec 2020色域)、最高终端侧显示屏支持高达4K HDR、最高外接显示屏也支持两个4K HDR显示屏,可实现硬件加速H.265和VP9解码、HDR播放编码器支持HDR10+、HDR10、HLG和Dolby Vision,Volumetric VR视频播放和8K 360 VR视频播放。同时,这个GPU还可以作为高通AI引擎的一个重要“能量”来源。

Hexagon 690:引入张量加速器的DSP

面对大家一直诟病的,没有给骁龙处理器加入NPU的问题,高通选择了在其骁龙的DSP Hexagon 690中加入一个张量加速器(Tensor Accelerator)。在被中国媒体问到,是否可以把这个张量加速器看作一个NPU的时候,高通的发言人笑着说,如果这样叫可以在中国卖出去更多芯片,你也可以这样叫。

据高通方面介绍,全新的Hexagon 690处理器包含一个全新设计的Hexagon张量加速器(Hexagon Tensor Accelerator,HTA)和四个Hexagon向量扩展内核(Hexagon Vector eXtensions,HVX),这是前代旗舰产品向量处理的两倍,并且还增加了四线程标量内核,综合实现了专有的、可编程的AI加速。

高通Hexagon 690 细节

从某个角度看,Hexagon 690是高通第四代AI Engine的重要部分。根据高通介绍,这个集合了GPU、CPU和DSP的骁龙855在AI方面实现每秒超过7万亿次运算(7TOPs),AI性能较前代旗舰移动平台相比提升3倍。这个新一代的引擎套件可以为Qualcom神经处理器SDK、Google Android NN-API以及Hexagon NN和Qualcomm Math Library带来一系列的提升。

高通AI Engine的动力来源

对于更广范围网络精度的优化和神经网络类别,能够实现对终端侧AI语音、拍摄、游戏和XR体验的支持,目前上述许多体验已经可以通过Qualcomm Technologies的AI软件合作伙伴实现,并将在下一代搭载骁龙855终端上支持。

高通第四代AI Engine的框架图

Spectra 380:带有机器视觉的ISP

这也是骁龙855的一个亮点之一。从拍摄的角度看,因为给ISP带来了机器视觉,很多相关的图像和视频处理可以直接在ISP上用硬件完成,这就带来了更加好的体验。

高通方面也表示,这个全新的、双14位计算机视觉ISP(CV-ISP)能够支持2200万像素@30fps的并行双摄像头和4800万像素@30fps的单摄像头的配置,可以实现包括对象侦测与追踪(梯度方向直方图、Harris角点检测、归一化互相关、线性分类与光流),以及立体景深处理的支持,还能实现摄像头子系统中的硬件稳像解决。

Spectra 380细节

全新模块ISP设计,支持图像管线输出更高的灵活性,包括RAW和YUV像素域, 支持人像模式(背景虚化)的4K 60 HDR视频拍摄(HRD10、HDR10+和HLG),10位色深,Rec 2020色域。提供了先进的HDR解决方案,包括增强的zzHDR、三重曝光四色滤波阵列(QCFA)HDR。另外,该ISP还让高通骁龙855支持HEIF照片拍摄和HEVC(H.265)视频拍摄。其中HEIF编码格式硬件加速可以将文件减小50%以便于更高效地存储或对用户自己生成的内容进行传输。高通方面表面,作为业界首个支持HDR10+视频拍摄的ISP,以卓越的对比度和视觉效果呈现超过10亿色,同时在功耗方面也有很大的优势。

Spectra 380的功耗对比

另外,作为全球第一款同时支持毫米波和Sub-6Ghz波段的处理器平台,骁龙855能通过集成的骁龙 X24 LTE调制解调器支持最佳的数千兆比特4G连接,也可以利用外挂X50 5G调制解调器的方式,带来5G方面的体验。

高通也为这个新旗舰引入了对Wi-Fi 6-ready的支持,其带来的诸如8×8探测机制的先进特性可以更高效地服务更多终端(与4 x4探测终端相比,效率提升高达2倍),目标唤醒时间(Target Wakeup Time)能效比也提升了高达67%。“该业界首款基于802.11ay的平台将Wi-Fi速度提升至前所未有的10Gbps”,高通强调。

从高通的发布会上的表达看来,他们对这个全新旗舰充满信心,一加手机刘作虎也表示将会在明年上半年推出基于骁龙855的5G手机。半导体行业观察也认为,高通的AI方面的策略再次证明,留给那些给手机芯片厂商供应加速器的IP厂商的时间已经不多了。

对于手机厂和芯片厂来说,下一步是推广AI应用在5G时代的大爆发,是下一个工作重点。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    454

    文章

    50485

    浏览量

    422221
  • 加速器
    +关注

    关注

    2

    文章

    795

    浏览量

    37790
  • 机器视觉
    +关注

    关注

    161

    文章

    4350

    浏览量

    120167
收藏 人收藏

    评论

    相关推荐

    张量计算在神经网络加速器中的实现形式

    引言 神经网络中涉及到大量的张量运算,比如卷积,矩阵乘法,向量点乘,求和等。神经网络加速器就是针对张量运算来设计的。一个神经网络加速器通常都包含一个
    的头像 发表于 11-02 13:52 2884次阅读
    <b class='flag-5'>张量</b>计算在神经网络<b class='flag-5'>加速器</b>中的实现形式

    #硬声创作季 电子制作:磁性加速器

    加速器DIY
    Mr_haohao
    发布于 :2022年10月19日 00:19:38

    从版本控制到全流程支持:揭秘Helix Core如何成为您的创意加速器

    加速器
    龙智DevSecOps
    发布于 :2024年11月26日 13:42:47

    关于长整加速器的工作步骤:

    关于长整加速器的工作步骤:1. 系统置位后,CPU向加速器的源地址寄存发送当前长整计算的源操作数地址(位于Memory中)2. 接着,CPU向加速
    发表于 03-17 10:53

    关于C6670 中NETCP网络加速器的使用

    各位TI 的工程师:      我最近在研究NETCP网络加速器的使用,我想做的是电脑通过网线连接到NETCP加速器实现与DSP之间的通信,传输协议依次为tcp、IPV4,请问有没有相关的例子可用
    发表于 06-21 10:15

    为什么汽车发动机升级产品,一种电子加速器能激发电的性能

    `请大师来解释一下,我认为在同一电源中,这边一种电子加速器产生了电的性能提升,那么在相通的同一电源中汽车发动机电子点火同样会产生与一种电子加速器相同电的性能提升,就像电子纠缠,像电话一
    发表于 09-12 22:20

    基于Fast Model的加速器软件开发

    随着arm生态系统的发展壮大,各种各样的应用场景层出不穷。为了更好地在特定场景下得到更好的性能,能耗比等指标,针对特定应用场景的加速器市场也在蓬勃发展,近年来火热的人工智能加速器
    发表于 07-29 15:38

    实时频谱分析仪(RSA)在加速器中的应用

    实时频谱分析仪(RSA)在加速器中的应用:1. 加速器的类型和用途我们为什么要使用加速器呢?下面列出了加速器的部分应用:2.
    发表于 10-17 17:41 23次下载

    快速晶闸管在加速器电源系统中的应用

    快速晶闸管在加速器电源系统中的应用 摘要:介绍了快速晶闸管在所研制的加速器电源系统中的应用,分析并解决了快速晶
    发表于 07-08 10:39 560次阅读
    快速晶闸管在<b class='flag-5'>加速器</b>电源系统中的应用

    工具包和Eval板帮助加速加速器应用

    加速器是一种使带电粒子增加速度(动能)的装置。 加速器可用于原子核实验、放射性医学、放射性化学、放射性同位素的制造、非破坏性探伤等。粒子增加的能量一般都在0.1兆电子伏以上。加速器的种
    发表于 09-14 10:05 13次下载
    工具包和Eval板帮助<b class='flag-5'>加速</b><b class='flag-5'>加速器</b>应用

    关于QorIQ安全加速器产品的介绍与使用(三)

    QorIQ安全加速器产品简介
    的头像 发表于 06-29 08:28 3329次阅读

    硬件加速器提升下一代SHARC处理性能

    硬件加速器提升下一代SHARC处理性能
    发表于 04-23 13:06 6次下载
    硬件<b class='flag-5'>加速器</b>提升下一代SHARC处理<b class='flag-5'>器</b>的<b class='flag-5'>性能</b>

    什么是AI加速器 如何确需要AI加速器

    AI加速器是一类专门的硬件加速器或计算机系统旨在加速人工智能的应用,主要应用于人工智能、人工神经网络、机器视觉和机器学习。
    发表于 02-06 12:47 4590次阅读

    TOPS 与现实世界的性能:AI 加速器的基准性能

    ) 指标的性能指导。TOPS 捕捉到“加速器在一秒钟内可以提供多少数学运算?” 比较和确定给定推理任务的最佳加速器。 虽然 TOPS 是一个“容易”计算的指标,但它通常无法为实际工作负载提供可靠的
    的头像 发表于 07-14 17:17 1862次阅读

    粒子加速器加速原理是啥呢?

    粒子加速器加速原理是啥呢? 粒子加速器是一种重要的实验设备,用于研究粒子物理学、核物理学等领域。其主要原理是通过电场和磁场的作用,对带电粒子进行加速,在高速运动过程中使其获得较大的动
    的头像 发表于 12-18 13:52 2006次阅读