0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

mW范围内的机器视觉使物联网端点推理变得实用

星星科技指导员 来源:嵌入式计算设计 作者:Semir Haddad 2022-06-06 09:19 次阅读

物联网端点位于嵌入式视觉的前沿。而且,与其他前沿领域一样,也存在挑战,尤其是功率效率。

机器视觉已经迅速在世界上找到了自己的位置。可以看到橙子并从树上摘下橙子。 凝视检测针对危险的无意识驾驶员。在工厂车间周围移动的工业机器人依靠它来进行安全的障碍物检测。

物联网端点位于嵌入式视觉的前沿。而且,与其他前沿领域一样,也存在挑战,尤其是功率效率。可以在不超过节点功率容量的情况下进行极端边缘的推理吗?

这个问题值得考虑。这是因为在边缘进行推理可以避免将数据(只有其中一些是可操作的)不加选择地传输到云端进行分析。这降低了存储成本。此外,云访问会损害延迟并抑制实时能力。旅行数据是易受攻击的数据,因此更可取端点处理。这也有利于降低支付给网络运营商的成本。

SoC 架构的新方法

然而,对于所有这些好处,存在一个主要的绊脚石。使用传统微控制器的设备的功耗限制在极端情况下阻碍了神经网络推理。

传统的微控制器 (MCU) 性能无法满足周期密集型操作。方法唤醒解决方案可能依赖机器视觉进行对象分类,而这又需要卷积神经网络 (CNN) 来执行矩阵乘法运算,从而转化为数百万乘法累加 (MAC) 计算(图 1)。

poYBAGKdVo6ATt8OAADnJcvFMII217.png

图 1. 迄今为止,微控制器无法高效处理大容量乘法累加 (MAC) 的问题一直是一个绊脚石。

MCU 存在各种神经网络。但是,这些解决方案未能成为生产就绪型解决方案,因为所需的性能无法超越功率障碍。

克服电源性能困境是为什么采用全新方法处理处理器角色和 SoC 架构的解决方案是有意义的。采用这种新方法需要了解物联网端点需要处理三个工作负载才能成功进行推理。一种是程序性的,一种是用于数字信号处理的,一种是执行大量 MAC 操作的。解决每个工作负载独特需求的一种方法是在 SoC 中结合用于信号处理和机器学习的双 MAC 16 位 DSP 和用于程序负载的 Arm Cortex-M CPU

这种混合多核架构利用了 DSP 双内存库、零循环开销和复杂的地址生成。使用它可以处理任何工作负载组合:例如,网络堆栈、RTOS、数字滤波器、时频转换、RNN、CNN 和传统的人工智能类搜索、决策树和线性回归。图 2 显示了当 DSP 架构优势发挥作用时,神经网络计算性能如何提高 2 倍甚至 3 倍。

poYBAGKdVpSACq-QAAEUFeNx8eY351.png

图 2. 矩阵乘法 (NxN) 基准。

仅仅改变架构是不够的

无论是嵌入式视觉系统还是其他依赖显着提高神经网络效率的系统,实现混合多核架构都很重要。然而,当目标是将功耗降低到 mW 范围时,还需要做更多的工作。认识到这一需求,Eta Compute 获得了连续电压和频率缩放 (CVFS) 专利。

CVFS 克服了动态电压频率缩放或 DVFS 遇到的问题。DVFS 确实利用了降低功率的选项,即降低电压。缺点是执行此选项时最大频率会降低。这个问题将 DVFS 的有效性限制在一个狭窄的范围内——一个由严格限制数量的预定义离散电压电平定义,并限制在几百 mV 的电压范围内。

相比之下,为了在最有效的电压下实现一致的 SoC 操作,CVFS 使用自定时逻辑。有了自定时逻辑,每个设备都可以连续自动调整电压和频率。CVFS 比 DVFS 更有效,也比亚阈值设计更容易实施,CVFS 在另一个重要方面也与这些不同。关键区别在于,上面提到的混合多核架构使 CVFS 已经在做的好事成倍增加。

极端边缘的生产级

处于极端边缘的端点,例如用于人员检测的端点,有特定的需求。尽管任何人都可以将已发布的神经网络用于这些物联网端点,但它们并没有优先满足这些需求。使用领先的设计技术优化这些网络可以解决这个问题。

除了使用先进的设计方法之外,我们在 Eta Compute 采用的神经网络优化方法集中在我们的生产级神经传感器处理器 ECM3532(图 3)上。它融合了混合多核架构和 CVFS 技术的所有优点。

poYBAGKdVpyAANjFAAIQrx-fZpc598.png

图 3. Eta Compute ECM3532 神经传感器处理器的混合多核架构,其中将 Arm Cortex-M3 处理器、NXP CoolFlux DSP、512KB 闪存、352KB SRAM 和支持外设集成在 SoC 中,使推理达到极致在可实现的 mW 范围内的边缘。

获得的知识

诸如图 4 所示结果的测试表明,为了将深度学习引入嵌入式视觉系统,电力成本不必上升到不可接受的水平。虽然没有一根魔杖可以为耗电的神经网络提供支持,但一种将 MCU 电源效率和 DSP 优势与网络优化相结合的方法可以帮助应用程序避免仅依赖云计算导致的安全性、延迟和低效率问题。

pYYBAGKdVrKAcTtFAAJSjVjrOyk700.png

图 4. 在人员检测模型的测试中,包括摄像头在内的平均系统功率达到了 5.6mW。对于该测试,速率为每秒1.3次推理,但进一步细化优化应将平均系统功率进一步降低至 4mW,同时将速率提高到每秒 2 次推理。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2903

    文章

    44284

    浏览量

    371324
  • 摄像头
    +关注

    关注

    59

    文章

    4810

    浏览量

    95451
  • 机器视觉
    +关注

    关注

    161

    文章

    4345

    浏览量

    120115
收藏 人收藏

    评论

    相关推荐

    ADS131A02 0-50的温度范围内,ADC输出漂移0.1%是怎么回事?

    请问ADS131A02在使用中,增益设置默认,当ADC输入3V时,在0℃-50℃范围内,MCU读取到ADS131输出漂移3mV左右;当输入是0.3V时,漂移量则为0.3mV,请问这个现象的如何解释?符合规格书要求吗?
    发表于 11-22 08:15

    中国蜂窝联网连接数领跑全球

    随着4G的普及和5G商用化进程的加速,与联网相结合的蜂窝联网产品逐渐增多,并在全球范围内展现出强大竞争力。
    的头像 发表于 11-01 15:32 696次阅读
    中国蜂窝<b class='flag-5'>物</b><b class='flag-5'>联网</b>连接数领跑全球

    全天候全覆盖的卫星通讯方案如何在联网系统中应用

    、高山等。这使得联网系统能够实现全球范围内的设备连接和数据传输,无论设备位于何处都能保持在线。 无缝连接:在多颗卫星组成的星座系统下,可以实现全球范围内的无缝连接。这种连接不受地理位
    的头像 发表于 09-30 15:29 553次阅读
    全天候全覆盖的卫星通讯方案如何在<b class='flag-5'>物</b><b class='flag-5'>联网</b>系统中应用

    PCM1794A的INL性能大概在多少lsb范围内

    请教下PCM1794A的INL性能大概在多少lsb范围内
    发表于 09-30 06:34

    机器视觉和计算机视觉有什么区别

    机器视觉和计算机视觉是两个密切相关但又有所区别的概念。 一、定义 机器视觉 机器
    的头像 发表于 07-16 10:23 471次阅读

    机器视觉的应用范围

    广泛,为人类社会的发展带来了巨大的便利。本文将详细介绍机器视觉的应用范围,包括工业自动化、无人驾驶、医疗健康、家庭服务、安防监控、农业、环境监测等多个方面。 一、工业自动化 机器
    的头像 发表于 07-04 11:33 527次阅读

    芯品# 联网市场性能最高的 NPU

    随着人工智能 (AI) 在我们的日常生活中继续发挥更大的影响力和影响,该领域正在从基于云的推理迁移到边缘和端点推理。基于边缘的推理为各种
    的头像 发表于 06-26 17:28 7754次阅读
    芯品# <b class='flag-5'>物</b><b class='flag-5'>联网</b>市场性能最高的 NPU

    如何在10uV误差允许范围内输出最低至几十微伏uV的交流方波信号?

    题主想要能够在10uV误差允许范围内输出最低至几十微伏uV的交流方波信号,最大频率为100kHz。目前有考虑过通过高位分辨率DAC+搭建无源衰减网络实现。想问问有什么低噪声放大器运放或者什么复合方法能比较准确输出这么低的方波信号吗。似乎噪声隔离也是一个很麻烦的问题。
    发表于 05-31 07:02

    行业热知 | 工业联网是什么?能在哪些行业应用?如何选择工业联网

    工业联网(IIoT)是联网的一个子集,专门应用于工业领域。它利用机器学习、大数据、智能传感器和机器
    的头像 发表于 03-29 13:52 970次阅读

    Microsoft Copilot for Security(国际版)将于4月1日在全球范围内正式发布

    今天,我们很高兴地宣布,Microsoft Copilot for Security (国际版) 将于 4 月 1 日在全球范围内正式发布。
    的头像 发表于 03-14 09:11 660次阅读

    分析 丨AI算法愈加复杂,但是机器视觉的开发门槛在降低

    机器视觉系统依赖于机器学习(machine learn)和深度学习(deep learn),尤其是深度学习的重要分支“卷积神经网络”在图像识别领域的应用,使
    的头像 发表于 02-19 16:49 631次阅读
    分析 丨AI算法愈加复杂,但是<b class='flag-5'>机器</b><b class='flag-5'>视觉</b>的开发门槛在降低

    在英特尔独立显卡上加速HALCON AI模型推理

    MVTec HALCON 是一款在全球范围内使用,综合性的机器视觉标准软件。它有一个专门的集成开发环境(HDevelop),专门用于开发图像处理解决方案。
    的头像 发表于 12-16 10:18 1445次阅读
    在英特尔独立显卡上加速HALCON AI模型<b class='flag-5'>推理</b>

    压电发声器驱动器如何在更宽广的电池电压范围内提高声压级

    压电发声器驱动器如何在更宽广的电池电压范围内提高声压级
    的头像 发表于 12-06 15:08 401次阅读
    压电发声器驱动器如何在更宽广的电池电压<b class='flag-5'>范围内</b>提高声压级

    什么是蓝牙技术的联网组网?四大蓝牙联网组网的方式

    什么是蓝牙技术的联网组网?四大蓝牙联网组网的方式  蓝牙技术是指一种无线通信技术,可在短距离范围内进行设备之间的数据传输和通信。
    的头像 发表于 11-30 11:28 2571次阅读

    机器视觉双目测宽仪具体有什么优势?

    、标称宽度、正负公差等;统计的最大、最小宽度及其对应的长度等;测量时显示宽度尺寸波动曲线。当测量数据处于设定的合格范围内时,测量值的数据颜色为绿色;当测量最大厚度偏差超出设定的允许范围时为红色。 产品
    发表于 11-28 17:13