优化嵌入式系统的工作负载,专用硬件来处理真正的人工智能算法-电子发烧友网

Liran Bar, Director of Product Marketing, CEVA

移动设备上的人工智能已经不再依赖于云端连接，今年CES最热门的产品演示和最近宣布的旗舰智能手机都论证了这一观点。人工智能已经进入终端设备，并且迅速成为一个市场卖点。包括安全、隐私和响应时间在内的这些因素，使得该趋势必将继续扩大到更多的终端设备上。为了满足需求，几乎每个芯片行业的玩家都推出了不同版本、不同命名的人工智能处理器，像“深度学习引擎”、“神经处理器”、“人工智能引擎”等等。

然而，并非所有的人工智能处理器都是一样的。现实是，许多所谓的人工智能引擎就是传统的嵌入式处理器（利用CPU和GPU）加上一个矢量向量处理单元（VPU）。VPU单元是专门为高效执行与计算机视觉及深度学习相关的繁重计算负载而设计的。虽然拥有一个强大的、低功耗的VPU是嵌入式人工智能的重要组成部分，但这不是故事的全部。VPU是组成一个出色的人工智能处理器的众多组件之一。VPU虽然经过精心设计，也确实提供了所需的灵活性，但它不是一个AI处理器。这里还有一些其它功能对于人工智能处理前端化至关重要。

NeuProTM - CEVA人工智能（机器学习）整体解决方案’（图片来源于CEVA）

优化嵌入式系统的工作负载

在云计算处理过程中，采用浮点计算进行训练，定点计算进行推理，从而实现最大的准确性。用大型服务器群组进行数据处理，能耗和大小必须考虑，但他们相较于有边缘约束的处理几乎是无限的。在移动设备上，功耗、性能和面积（PPA）的可行性设计至关重要。因此在嵌入式SoC芯片上，优先采用更有效的定点计算。当将网络从浮点转换为定点时，会不可避免的损失掉一些精度。然而正确的设计可以最小化精度损失，可以达到与原始训练网络几乎相同的结果。

控制精度的方法之一是在8位和16位整数精度之间做出选择。虽然8位精度可以节省带宽和计算资源，但是许多商用的神经网络仍然需要采用16位精度以保证准确性。神经网络的每一层都有不同的约束和冗余，因此为每一层选择最佳的精度是至关重要的。

以层为单位选择最佳精度（图片来源于 CEVA）

针对开发人员和SoC设计者，一个工具可以自动输出优化的图形编译器和可执行文件，例如CEVA网络生成器，从上市时间的角度来看是一个巨大的优势。此外，保持为每一层选择最佳精度（8位或16位）的灵活性也是很重要的。这使每一层都可以在优化精度和性能之间进行权衡，然后一键生成高效和精确的嵌入式网络推理。

专用硬件来处理真正的人工智能算法

VPU使用灵活，但许多最常见的神经网络需要的大量带宽通道对标准处理器指令集提出了挑战。因此，必须有专门的硬件来处理这些复杂的计算。

例如NeuPro AI处理器包括专用的引擎处理矩阵乘法、完全连接层、激活层和汇聚层。这种先进的专用AI引擎结合完全可编程工作的NeuPro VPU，可以支持所有其它层类型和神经网络拓扑。这些模块之间的直接连接允许数据无缝交换，不再需要写入内存。此外，优化的DDR带宽和先进的DMA 控制器采用动态流水线处理，可以进一步提高速度，同时降低功耗。

结合NeuPro 引擎和 NeuPro VPU的 NeuPro AI处理器框图（图片来源于：CEVA）

明天未知的人工智能算法

人工智能仍然是一个新兴且快速发展的领域。神经网络的应用场景快速增加，例如目标识别、语音和声音分析、5G 通信等等。保持一种适应性的解决方案满足未来趋势是确保芯片设计成功唯一的途径。因此，满足现有算法的专用硬件肯定是不够的，还必须搭配一个完全可编程的平台。在算法一直不断改进的情况下，计算机模拟仿真是基于实际结果进行决策的关键工具，并且减少了上市时间。CDNN PC仿真包允许SoC设计人员在开发真实硬件之前，就可以使用PC环境权衡自己的设计。

另一个满足未来需求的宝贵特征是可扩展性。NeuPro AI产品家族可以应用于广泛的目标市场，从轻量型的物联网和可穿戴设备（2TOPs）到高性能的行业监控和自动驾驶应用（12.5 TOPs）。

在移动端实现旗舰AI处理器的竞赛已经开始。许多人快速赶上了这一趋势，使用人工智能作为自己产品的卖点，但并不是所有产品里都具备相同的智能水平。如果想要创建一个在不断发展的人工智能领域保持“聪明”的智能设备，应该确保在选择AI处理器时，检查上述提到的所有特性。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1792

文章
47409

浏览量
238924
嵌入式处理器

嵌入式处理器

+关注

关注
0

文章
255

浏览量
30759
机器学习

机器学习

+关注

关注
66

文章
8424

浏览量
132766

原文标题：为什么某些嵌入式 AI 处理器比其它更智能

文章出处：【微信号：CEVA-IP，微信公众号：CEVA】欢迎添加关注！文章转载请注明出处。

嵌入式人工智能的就业方向有哪些?

嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下，嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下，众多名企也纷纷在

发表于 02-26 10:17

嵌入式和人工智能究竟是什么关系?

应用场景。例如，在智能家居领域，嵌入式系统可以控制各种智能设备，如智能灯泡、智能空调等，而

发表于 11-14 16:39

人工智能成热潮，嵌入式如何分杯羹？

？嵌入式工程师又该如何把握住人工智能所带来的重大机遇呢？人工智能与嵌入式系统的关系，可用苏轼《题西林壁》的诗句来形容，即“横看成岭侧成峰，远

发表于 09-06 18:14

智能控制、人工智能、智能算法的发展前景怎么样

浅谈智能控制、人工智能、智能算法的发展前景

发表于 05-10 01:21

嵌入式与人工智能关系是什么

嵌入式与人工智能关系_嵌入式人工智能的发展趋势　　所谓嵌入式人工智能，就是设备无须联网通过云端数

发表于 10-27 07:41

什么叫嵌入式人工智能

什么是嵌入式人工智能，它的实际应用百度大脑、语音搜索、图像、广告跟搜索排序及自动驾驶，用一句简单的话来概括就是在云端基于大数据、大计算做人工智能，这看起来是人工智能的主流。什么叫

发表于 10-28 08:43

嵌入式人工智能简介

嵌入式人工智能-简要了解OPEN AI LAB嵌入式人工智能开发套件（EAIDK）AIoTOPEN AI LAB最开始听到这个名字，以为是一家国外的公司或者是一个开源社区，登录官网之后

发表于 10-28 09:44

嵌入式人工智能的相关资料分享

已经有很多关于将人工智能用于日益智能的车辆的文章。但是，您如何将在服务器群上开发的神经网络 (NN) 压缩到量产汽车中资源受限的嵌入式硬件中呢？本文探讨了我们应该如何授权汽车生产 AI

发表于 11-08 07:18

什么叫嵌入式，以及与人工智能的关系

(参考知乎)一、什么叫嵌入式，以及与人工智能的关系？嵌入式原本是嵌入式系统，但是由于现在电子设备众多，导致

发表于 11-08 08:49

嵌入式与人工智能关系是什么？

嵌入式与人工智能关系是什么？嵌入式人工智能的发展趋势是什么？

发表于 12-27 07:13

嵌入式人工智能学习路线

的的实际案例，例如：目标检测、人脸识别、微表情识别、车牌识别、数字识别和语音识别等，真正的做到人工智能+嵌入式的项目实践以及理论学习。人工智能机器人

发表于 09-16 17:07

《移动终端人工智能技术与应用开发》人工智能的发展与AI技术的进步

人工智能的发展是随着人类生活需要，产业需求不断提升的，其中人工智能的发展很大程度上受到了计算机算力的影响，随着数据处理量的增大，人工智能算法对算力的要求逐年增加，而且没过两年算力上升一

发表于 02-17 11:00

优化嵌入式系统的工作负载，专用硬件来处理真正的人工智能算法

人工智能仍然是一个新兴且快速发展的领域。神经网络的应用场景快速增加，例如目标识别、语音和声音分析、5G通信等。保持一种适应性的解决方案，满足未来趋势是确保芯片设计成功唯一途径。

发表于 06-03 10:09 •4209次阅读

嵌入式人工智能技术的开发和应用

人工智能算法如何有效地运行在嵌入式智能终端（即边缘计算）是近年研究的热点，本文从嵌入式人工智能技术研究的意义以及所面临的问题入手，并从

发表于 09-04 17:13 •5180次阅读

人工智能算法有哪些

人工智能算法有哪些 人工智能( Artificial Intelligence, AI) 是一门多学科交叉的科学，是研究以计算机为基础的智能化理论、方法、技术和应用系统的新型学科领域。

发表于 08-12 16:58 •5849次阅读

搜索历史

优化嵌入式系统的工作负载,专用硬件来处理真正的人工智能算法

评论