0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

mW范围内的机器视觉使物联网端点推理变得实用

星星科技指导员 来源:嵌入式计算设计 作者:Semir Haddad 2022-11-25 15:04 次阅读

物联网端点位于嵌入式视觉的前沿。而且,与其他前沿领域一样,也存在挑战,其中最重要的是电源效率。

机器视觉已经迅速在世界上找到了自己的位置。从树上看到和摘下橙子。注视检测针对危险的无意识驾驶员。在工厂车间内移动的工业机器人依靠它进行安全的障碍物检测。

物联网端点位于嵌入式视觉的前沿。而且,与其他前沿领域一样,也存在挑战,其中最重要的是电源效率。是否可以在不超出节点功率容量的情况下在极端边缘进行推理?

这个问题值得考虑。这是因为在边缘进行推理可以避免不分青红皂白地将数据(其中只有一部分是可操作的)传输到云进行分析。这样可以降低存储成本。此外,访问云会损害延迟并抑制实时功能。传输数据是易受攻击的数据,因此最好进行端点处理。这对于降低支付给网络运营商的成本也是有利的。

全新的 SoC 架构方法

然而,对于所有这些好处,一个主要的绊脚石已经存在。使用传统微控制器的设备的功耗限制阻碍了神经网络在极端边缘的推理。

传统的微控制器(MCU)性能无法满足周期密集型操作。方法唤醒解决方案可能依赖于机器视觉进行对象分类,这反过来又需要卷积神经网络 (CNN) 执行矩阵乘法运算,这些运算转化为数百万乘法累加 (MAC) 计算(图 1)。

pYYBAGOAaQ-AUCSLAABNEeCv-tA482.png

图1.到目前为止,微控制器不具备承担大容量乘法累加(MAC)的效率的问题一直是一个绊脚石。

MCU存在各种各样的神经网络。但是,这些未能作为生产就绪型解决方案流行起来,因为所需的性能无法超越电源障碍。

克服功耗-性能困境是为什么采用全新方法处理处理器角色和 SoC 架构的解决方案是有意义的。采用这种新方法需要了解 IoT 终结点需要处理三个工作负载才能成功推理。一个是程序性的,一个是数字信号处理,一个是执行大量MAC操作的。满足每个工作负载独特需求的一种方法是在 SoC 中组合一个用于信号处理和机器学习的双 MAC 16 位 DSP,以及一个用于程序负载的 Arm Cortex-M CPU

这种混合多核架构充分利用了 DSP 双存储器组、零环路开销和复杂地址生成。有了它,可以处理工作负载的任何组合:例如,网络堆栈、RTOS、数字滤波器、时频转换、RNN、CNN 以及传统的类似人工智能的搜索、决策树和线性回归。图 2 显示了当 DSP 架构优势发挥作用时,神经网络计算性能如何提高 2 倍甚至 3 倍。

poYBAGOAaRKAaBrmAABHJTx6EI4881.png

图2.矩阵乘法 (NxN) 基准测试。

仅靠架构更改是不够的

无论是对于嵌入式视觉系统还是依赖于显著提高神经网络效率的任何其他系统,实施混合多核架构都很重要。但是,当目标是将功耗降至mW范围时,必须做更多的工作。认识到这一需求,Eta Compute获得了连续电压和频率缩放(CVFS)的专利。

CVFS克服了动态电压频率调节(DVFS)遇到的问题。DVFS确实利用了降低功耗的选项,即降低电压。缺点是行使此选项时最大频率会降低。这个问题将DVFS的有效性锁定在一个狭窄的范围内 - 一个由严格限制数量的预定义离散电压电平定义并限制在几百mV的电压范围内。

相比之下,为了在最有效的电压下实现一致的SoC操作,CVFS使用自定时逻辑。通过自定时逻辑,每个器件都可以连续自动调整电压和频率。CVFS比DVFS更有效,也比亚阈值设计更容易实施,CVFS在另一个重要方面也与这些不同。关键区别在于,上面提到的混合多核架构使CVFS已经做的好事成倍增加。

处于最前沿的生产级

最边缘的终结点(例如用于人员检测的终结点)具有特定需求。虽然已发布的神经网络可供任何人用于这些物联网端点,但它们并没有优先针对这些需求。使用领先的设计技术优化这些网络可以解决这个问题。

除了使用先进的设计方法外,我们在 Eta Compute 采用的神经网络优化方法以生产级神经传感器处理器 ECM3532 为中心(图 3)。它融合了混合多核架构和 CVFS 技术的所有优势。

pYYBAGOAaROAXkmEAACaec4WlEQ704.png

图3.Eta Compute ECM3532神经传感器处理器的混合多核架构将Arm Cortex-M3处理器、恩智浦CoolFlux DSP、512KB闪存、352KBSRAM和支持外设集成在SoC中,可实现mW范围内最边缘的推理。

获得的知识

如图4所示的测试结果显示,为了将深度学习引入嵌入式视觉系统,电力成本不必上升到不可接受的水平。虽然没有一根魔杖可以为高功耗的神经网络供电,但将MCU功耗效率和DSP优势与网络优化相结合的方法可以帮助应用避免仅依赖云计算导致的安全性、延迟和低效率问题。

pYYBAGOAaRWAK7nZAABgSkhPLA0722.png

图4.在对人员检测模型的测试中,包括相机在内的平均系统功耗为5.6mW。对于此测试,速率为每秒 1.3 个审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 控制器
    +关注

    关注

    112

    文章

    16402

    浏览量

    178555
  • 物联网
    +关注

    关注

    2910

    文章

    44773

    浏览量

    374637
  • 机器视觉
    +关注

    关注

    162

    文章

    4389

    浏览量

    120445
收藏 人收藏

    评论

    相关推荐

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    将自然语言理解与运动规划融为一体。这种端到端的方法使机器人能够直接从人类指令生成动作序列,大幅简化了控制流程。该项目的工作流程包含设计并封装一个人机器人函数库、编写清晰地描述提示词、在仿真环境中执行
    发表于 12-24 15:03

    ad7124上电开启诊断结果,显示LDO不在范围内,是哪里出错了?

    上电开启诊断结果,并输出--串口打印显示 0x80------模拟LDO不在范围内 万用表实际测量有1.89V,是在范围内的; 请问这种情况是芯片坏了?应该不是芯片坏了吧。数据能输出
    发表于 12-19 08:58

    ADS1230怎么处理才能使信号在芯片量程范围内

    要用10-15V电压给重量传感器,那需要怎么处理才能使信号在芯片量程范围内,加运放?且是负反馈?求高手指教,不胜感激
    发表于 12-19 07:01

    请问ldc1101是否能够检测到圆球在摆幅范围内不同位置的相对距离?

    应用场景:线圈在磁性圆球下大约1cm以内,线圈静止,圆球会缓慢水平摆动,摆动幅度约0.5cm。请问ldc1101是否能够检测到圆球在摆幅范围内不同位置的相对距离?
    发表于 12-09 07:04

    ADS131A02 0-50的温度范围内,ADC输出漂移0.1%是怎么回事?

    请问ADS131A02在使用中,增益设置默认,当ADC输入3V时,在0℃-50℃范围内,MCU读取到ADS131输出漂移3mV左右;当输入是0.3V时,漂移量则为0.3mV,请问这个现象的如何解释?符合规格书要求吗?
    发表于 11-22 08:15

    中国蜂窝联网连接数领跑全球

    随着4G的普及和5G商用化进程的加速,与联网相结合的蜂窝联网产品逐渐增多,并在全球范围内展现出强大竞争力。
    的头像 发表于 11-01 15:32 791次阅读
    中国蜂窝<b class='flag-5'>物</b><b class='flag-5'>联网</b>连接数领跑全球

    全天候全覆盖的卫星通讯方案如何在联网系统中应用

    、高山等。这使得联网系统能够实现全球范围内的设备连接和数据传输,无论设备位于何处都能保持在线。 无缝连接:在多颗卫星组成的星座系统下,可以实现全球范围内的无缝连接。这种连接不受地理位
    的头像 发表于 09-30 15:29 865次阅读
    全天候全覆盖的卫星通讯方案如何在<b class='flag-5'>物</b><b class='flag-5'>联网</b>系统中应用

    PCM1794A的INL性能大概在多少lsb范围内

    请教下PCM1794A的INL性能大概在多少lsb范围内
    发表于 09-30 06:34

    机器视觉和计算机视觉有什么区别

    机器视觉和计算机视觉是两个密切相关但又有所区别的概念。 一、定义 机器视觉 机器
    的头像 发表于 07-16 10:23 558次阅读

    机器视觉的应用范围

    广泛,为人类社会的发展带来了巨大的便利。本文将详细介绍机器视觉的应用范围,包括工业自动化、无人驾驶、医疗健康、家庭服务、安防监控、农业、环境监测等多个方面。 一、工业自动化 机器
    的头像 发表于 07-04 11:33 642次阅读

    芯品# 联网市场性能最高的 NPU

    随着人工智能 (AI) 在我们的日常生活中继续发挥更大的影响力和影响,该领域正在从基于云的推理迁移到边缘和端点推理。基于边缘的推理为各种
    的头像 发表于 06-26 17:28 7852次阅读
    芯品# <b class='flag-5'>物</b><b class='flag-5'>联网</b>市场性能最高的 NPU

    如何在10uV误差允许范围内输出最低至几十微伏uV的交流方波信号?

    题主想要能够在10uV误差允许范围内输出最低至几十微伏uV的交流方波信号,最大频率为100kHz。目前有考虑过通过高位分辨率DAC+搭建无源衰减网络实现。想问问有什么低噪声放大器运放或者什么复合方法能比较准确输出这么低的方波信号吗。似乎噪声隔离也是一个很麻烦的问题。
    发表于 05-31 07:02

    行业热知 | 工业联网是什么?能在哪些行业应用?如何选择工业联网

    工业联网(IIoT)是联网的一个子集,专门应用于工业领域。它利用机器学习、大数据、智能传感器和机器
    的头像 发表于 03-29 13:52 1082次阅读

    Microsoft Copilot for Security(国际版)将于4月1日在全球范围内正式发布

    今天,我们很高兴地宣布,Microsoft Copilot for Security (国际版) 将于 4 月 1 日在全球范围内正式发布。
    的头像 发表于 03-14 09:11 723次阅读

    分析 丨AI算法愈加复杂,但是机器视觉的开发门槛在降低

    机器视觉系统依赖于机器学习(machine learn)和深度学习(deep learn),尤其是深度学习的重要分支“卷积神经网络”在图像识别领域的应用,使
    的头像 发表于 02-19 16:49 702次阅读
    分析 丨AI算法愈加复杂,但是<b class='flag-5'>机器</b><b class='flag-5'>视觉</b>的开发门槛在降低