Imagination发布其最新一代IMG Series4神经网络加速器产品-电子发烧友网

随着智能驾驶和自动驾驶等应用越发火热，汽车AI 芯片市场在最近几年进入了高速发展期。无论是NXP和瑞萨这样的传统汽车芯片厂，还是如英伟达和英特尔这样的消费芯片大厂，甚至是FPGA龙头Xilinx，都对这个市场虎视眈眈。此外，国内外也有一大波初创芯片企业涌入这个市场。 Imagination作为全球半导体IP大厂，已推出多代AI加速产品，获得了良好的市场反响，可以为汽车芯片厂商打造高性能车用AI芯片提供强有力的支持。日前，Imagination发布其最新一代IMG Series4神经网络加速器（NNA）产品，该公司视觉和人工智能部门高级总监Andrew Grant在接受媒体采访时指出：“虽然目前市场上已经有能满足自动驾驶需求的AI芯片，但功耗不够理想。所以，我们花两年时间去了解和评估客户需求，推出了高性能低功耗的4系列NNA产品，并且将自动驾驶作为主打市场”。

Andrew Grant还介绍道，IMG Series4 NNA采用了全新的多核架构，能提供高达600 TOPS的算力，从而为ADAS和自动驾驶等应用提供高效支持。Imagination之所以能提供性能如此强悍的产品，得益于公司多年来在IP领域的深厚积累。

IP专家的步步为“赢”

在谈及Imagination的时候，大家首先想到的就是他们在手机 GPU IP市场的影响力。

从Imagination提供的数据也可以看到，他们在移动GPU IP市场的份额已经达到35.5%，这帮助他们超越Arm Mali系列和高通Adreno系列，登上移动GPU IP龙头的位置。除了移动GPU以外，Imagination在车载GPU IP市场也几乎拿下了半壁江山。数据显示，他们在这个市场的占有率高达43%。

此外，Imagination在近来热门的AI 市场也布局多年。据介绍，Imagination在过去七年里持续加大对AI研发的投入，公司迄今已拥有超过80项针对AI领域的专利，并推出了一系列神经网络加速器IP产品。这系列IP是一个从0开始设计的完整、独立式的硬件IP神经网络加速器，可以同时支持CNN、RNN、LSTM三种神经网络类型，并且可支持caff、caffe2、Google TensorFlow等通用机器学习体系架构，还支持可适用于移动端的TensorFlow Lite、caffe2go等机器学习体系架构。再加上这系列内核可在最小的硅面积上以非常低的功耗实现高性能的神经网络计算，因此自面世以来获得了客户的高度认可。Imagination在过去几年里也在快速迭代该系列IP。

2017年9月，Imagination发布了旗下首款神经网络加速器PowerVR Series 2NX NNA，其单核性能仅覆盖1 TOPS到4.1 TOPS的范围；而到了2018年推出的第二代PowerVR 3NX，单核性能不但覆盖了0.6 TOPS到10 TOPS，其多核产品性能更是能做到20 TOPS到160 TOPS，可以满足从L2级到L5级自动驾驶的边缘推理需求。而文章开头谈到的IMG Series 4NNA则是Imagination推出的第三代NNA。 Andrew Grant表示，这款公司历时两年打造出来的产品不但在性能上获得大幅度提升，还拥有灵活的多核设计、创新性的Tensor Tiling（ Imagination’s Tensor Tiling，ITT）技术、低功耗和满足车规级安全需求等多项优势，从而能为领先的汽车行业颠覆者、一级供应商、整车厂（OEM）和汽车系统级芯片（SoC）厂商提供强大助力。

IMGSeries4 NNA 的强势出击

根据Andrew Grant的观点，当前的车载AI芯片拥有三方面的需求，分别是超强性能、超低功耗和超低延迟。当然，作为汽车级别的芯片，安全也是必不可少的，这就是IMG Series 4 NNA的设计指导。

从官方提供的资料我们可以看到，Series4具有以下特性：首先是多核扩展性和灵活性方面，据Imagination介绍，其多核架构支持在多个核之间对工作负载进行灵活的分配和同步。Imagination的软件提供了精细的控制能力，并通过对多个工作负载进行批处理、拆分和调度而提高了灵活性，现在可以在任意数量的内核上使用。Series4可为每个集群配置 2个、4个、6个或者8个核。

其次是性能。据介绍，Series4的每个单核能够以不到一瓦的功耗提供12.5 TOPS的性能。举例来说，一个8核集群在5nm工艺的加持下，可以提供100 TOPS的算力。那就代表着配有6个8核集群的解决方案可以提供600 TOPS的算力。来到AI推理方面，Series4 NNA的性能比嵌入式GPU快20倍以上，与嵌入式CPU相比，更是快了1000倍。

第三，超低延迟也是这一代NNA IP的另一个特性。据了解，通过将多个单核组成2核、4核、6核或8核的多核集群，所有内核可以相互协作，并行处理一个任务。这就降低了处理延迟，缩短响应时间。数据显示，对于一个8核集群，理想情况下延迟会减少为单核独立执行时的1/8。节省大量带宽则是Imagination新NNA的另一大优势，这主要得益于公司正在申请专利的的Tensor Tiling技术（Imagination’s Tensor Tiling，ITT），这也是Series4中新增的功能。据介绍，借助这项技术，Imagination的Series4可以通过对计算任务进行tiling，充分利用片上存储，提升数据处理效率，并节省访问外部存储的带宽。

在具体操作中，针对不同的任务，有不同的操作方式。据了解，在批处理大量的小型任务时，Tensor Tiling能够把批处理任务分配到各个NNA单核，让每个NNA单核独立工作，提升并行处理的能力；而在面对一些大型网络的时候，Tensor Tiling则可以从多个维度拆分任务，让所有NNA单核共同执行一个推理任务。这不但减少了网络推理的延迟，在理想情况下，协同并行处理的吞吐量与独立并发处理也是相同的。值得一提的是，这里的拆分都是通过Imagination的编译器来完成的，不需要开发者手动操作，借助NNA的性能分析工具，开发者还能对AI任务进行更好的调度和分配。

另外，因为利用本地数据的依赖性将中间数据保存在片上存储器中，ITT可以最大限度地减少将数据传输至外部存储器，从而将带宽降低多达90％。作为一种可扩展的算法，ITT在拥有大量输入数据的网络上具有显著优势。车规级安全性则是Series4不得不提的另一个优势。众所周知，汽车芯片对安全提出了更高的要求。Imagination为其全新的NNA引入了IP级别的安全功能，且产品的设计流程符合ISO 26262标准，这就能帮助客户更容易获得ISO 26262认证。据报道，Series4可以在不影响性能的情况下，安全地进行神经网络推理。硬件安全机制可以保护编译后的网络、网络的执行和数据处理管道。

在IMG Series4 NNA的发布会上，Andrew Grant除了介绍新IP的硬件性能外，也同时讲述公司围绕这系列芯片打造的软件生态系统，这与硬件配合，加速了开发者的开发速度，简化了开发流程。而为了给汽车运算提供更多的算力支持，Imagination还打通了NNA多核平台与GPU协同，给开发者提供更多的选择。

Andrew Grant在发布会上表示，公司的IMG Series4 NNA已经开始向客户提供授权，产品也将于2020年12月在市场上全面供应。 ABI Research智慧出行和汽车首席分析师James Hodgson说道：“在从L2和L3级ADAS向L4和L5级全自动驾驶演进的过程中，神经网络的广泛应用将是至关重要的因素。这些系统将要处理数以百计的复杂场景，从多个摄像头和激光雷达等大量传感器中提取数据，从而实现自动代客泊车、十字路口管理和复杂城市环境安全导航等解决方案。高性能、低延迟和高能效的结合将是实现高度自动驾驶的关键所在。” 由此可见，一个全新的大门正在面向Imagination开启。

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

传感器

传感器

+关注

关注
2551

文章
51207

浏览量
754536
imagination

imagination

+关注

关注
1

文章
573

浏览量
61360
AI芯片

AI芯片

+关注

关注
17

文章
1889

浏览量
35095

原文标题：推出600 Tops产品，Imagination持续发力汽车AI芯片市场

文章出处：【微信号：Imgtec，微信公众号：Imagination Tech】欢迎添加关注！文章转载请注明出处。

卷积神经网络与传统神经网络的比较

神经网络，也称为全连接神经网络（Fully Connected Neural Networks，FCNs），其特点是每一层的每个神经元都与下

发表于 11-15 14:53 •555次阅读

什么是神经网络加速器？它有哪些特点？

神经网络加速器是一种专门设计用于提高神经网络计算效率的硬件设备。随着深度学习技术的快速发展和广泛应用，神经网络模型的复杂度和计算量急剧增加，

发表于 07-11 10:40 •523次阅读

BP神经网络和人工神经网络的区别

BP神经网络和人工神经网络（Artificial Neural Networks，简称ANNs）之间的关系与区别，是神经网络领域中一个基础且重要的话题。本文将从定义、结构、算法、应用及

发表于 07-10 15:20 •1164次阅读

rnn是递归神经网络还是循环神经网络

RNN（Recurrent Neural Network）是循环神经网络，而非递归神经网络。循环神经网络是一种具有时间序列特性的神经网络，能

发表于 07-05 09:52 •592次阅读

递归神经网络与循环神经网络一样吗

神经网络是一种基于树结构的神经网络模型，它通过递归地将输入数据分解为更小的子问题来处理序列数据。RvNN的核心思想是将复杂的序列问题

发表于 07-05 09:28 •906次阅读

递归神经网络是循环神经网络吗

递归神经网络（Recurrent Neural Network，简称RNN）和循环神经网络（Recurrent Neural Network，简称RNN）实际上是同一个概念，只是不同的翻译方式

发表于 07-04 14:54 •809次阅读

循环神经网络和卷积神经网络的区别

结构。它们在处理不同类型的数据和解决不同问题时具有各自的优势和特点。本文将从多个方面比较循环神经网络和卷积神经网络的区别。基本概念循环神经网络是一种具有循环连接的

发表于 07-04 14:24 •1346次阅读

人工智能神经网络的结构是什么

人工智能神经网络是一种模拟人脑神经网络的计算模型，其结构和功能非常复杂。引言人工智能神经网络是一

发表于 07-04 09:37 •605次阅读

反向传播神经网络和bp神经网络的区别

反向传播神经网络（Backpropagation Neural Network，简称BP神经网络）是一种多层前馈神经网络，它通过反向传播算法来调整网

发表于 07-03 11:00 •829次阅读

bp神经网络和卷积神经网络区别是什么

结构、原理、应用场景等方面都存在一定的差异。以下是对这两种神经网络的比较：基本结构 BP神经网络是一种多层前馈神经网络，由输入层、隐藏层和

发表于 07-03 10:12 •1247次阅读

卷积神经网络和bp神经网络的区别

不同的神经网络模型，它们在结构、原理、应用等方面都存在一定的差异。本文将从多个方面对这两种神经网络进行详细的比较和分析。引言 神经网络是一

发表于 07-02 14:24 •4324次阅读

西门子推出Catapult AI NN:重塑神经网络加速器设计的未来

的需求，西门子数字化工业软件日前推出了一款名为Catapult AI NN的创新软件，旨在帮助神经网络加速器在专用集成电路（ASIC）和芯片级系统（SoC）上实现更高效的高层次综合（HLS）。

发表于 06-19 16:40 •736次阅读

西门子推出Catapult AI NN软件，赋能神经网络加速器设计

西门子数字化工业软件近日发布了Catapult AI NN软件，这款软件在神经网络加速器设计领域迈出了重要一步。Catapult AI NN软件专注于在专用集成电路（ASIC）和芯片级

发表于 06-19 11:27 •881次阅读

Arm发布新一代Ethos-U AI加速器 Arm旨在瞄准国产CPU市场

Arm发布的新一代Ethos-U AI加速器确实在业界引起了广泛关注。

发表于 04-18 15:59 •776次阅读

NVIDIA将在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”

根据各方信息和路线图，NVIDIA预计会在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”。

发表于 03-04 09:33 •1357次阅读

搜索历史

Imagination发布其最新一代IMG Series4神经网络加速器产品

评论

卷积神经网络与传统神经网络的比较

什么是神经网络加速器？它有哪些特点？

BP神经网络和人工神经网络的区别

rnn是递归神经网络还是循环神经网络

递归神经网络与循环神经网络一样吗

递归神经网络是循环神经网络吗

循环神经网络和卷积神经网络的区别

人工智能神经网络的结构是什么

反向传播神经网络和bp神经网络的区别

bp神经网络和卷积神经网络区别是什么

卷积神经网络和bp神经网络的区别

西门子推出Catapult AI NN:重塑神经网络加速器设计的未来

西门子推出Catapult AI NN软件，赋能神经网络加速器设计

Arm发布新一代Ethos-U AI加速器 Arm旨在瞄准国产CPU市场

NVIDIA将在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”