0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

mW范围内的机器视觉使物联网端点推理变得切实可行

星星科技指导员 来源:嵌入式计算设计 作者:Semir Haddad 2022-10-14 14:59 次阅读

机器视觉已经在世界上迅速找到了自己的位置。从树上看到和采摘橙子。注视检测针对危险不明的驾驶员。在工厂车间移动的工业机器人依靠它进行安全障碍物检测。

物联网端点位于嵌入式视觉的前沿。而且,与其他前沿领域一样,也存在挑战,其中最重要的是电源效率。是否可以在不超出节点功率容量的情况下在极端边缘进行推理?

这个问题值得考虑。这是因为在边缘进行推理可以避免不加选择地将数据(其中只有一些是可操作的)传输到云进行分析。这降低了存储成本。此外,访问云会损害延迟并抑制实时功能。传输数据是易受攻击的数据,因此端点处理更可取。这对于降低支付给网络运营商的成本也是有利的。

一种全新的 SoC 架构方法

然而,对于所有这些好处,一个主要的绊脚石仍然存在。使用传统微控制器的器件的功耗限制阻碍了极端边缘的神经网络推理。

传统的微控制器(MCU)性能无法达到周期密集型操作。方法唤醒解决方案可能依赖于机器视觉进行对象分类,而机器视觉又需要卷积神经网络 (CNN) 执行矩阵乘法运算,从而转换为数百万乘法累加 (MAC) 计算(图 1)。

poYBAGNJCSiAWO9SAAEWRe_sYzI951.png

图 1.到目前为止,微控制器无法承受大容量乘法累加(MAC)的效率问题一直是绊脚石。

MCU存在各种各样的神经网络。但是,这些未能作为生产就绪的解决方案流行起来,因为所需的性能无法超越电源障碍。

克服功耗-性能难题是为什么对处理器角色和 SoC 架构采用全新方法的解决方案是有意义的。采用这种新方法需要了解物联网端点有三个工作负载需要处理才能成功推理。一个是程序性的,一个是用于数字信号处理的,一个是执行大量的MAC操作。满足每个工作负载独特需求的一种方法是在 SoC 中将用于信号处理和机器学习的双 MAC 16 位 DSP 和用于程序负载的 Arm Cortex-M CPU 组合在一起。

这种混合多核架构充分利用了 DSP 双存储体、零环路开销和复杂地址生成。有了它,可以处理工作负载的任意组合:例如,网络堆栈,RTOS,数字滤波器,时频转换,RNN,CNN以及传统的类似人工智能的搜索,决策树和线性回归。图 2 显示了当 DSP 架构优势发挥作用时,神经网络计算性能如何提高 2 倍甚至 3 倍。

pYYBAGNJCTCAUDVLAAERzsxYMvs002.png

图 2.矩阵乘法 (NxN) 基准测试。

仅靠架构更改是不够的

无论是对于嵌入式视觉系统还是依赖于显著提高神经网络效率的任何其他系统,实施混合多核架构都很重要。但是,当目标是将功耗降至mW范围时,必须做更多的工作。认识到这一需求,埃塔计算获得了专利的连续电压和频率调节(CVFS)。

CVFS 克服了动态电压频率缩放或 DVFS 遇到的问题。DVFS确实利用了降低功率的选项,即降低电压。缺点是,当执行此选项时,最大频率会降低。这个问题将DVFS的有效性固定在一个狭窄的范围内——一个由严格限制数量的预定义离散电压电平定义,并束缚在几百mV的电压范围内。

相比之下,为了在最有效的电压下实现一致的 SoC 操作,CVFS 使用自定时逻辑。通过自定时逻辑,每个器件都可以在连续的范围内自动调整电压和频率。CVFS比DVFS更有效,也比亚阈值设计更容易实施,CVFS在另一个重要方面也与这些不同。这个关键的区别在于,上面提到的混合多核架构使CVFS已经做的好处成倍增加。

生产级极致边缘

极端边缘的端点(例如用于人员检测的端点)具有特定需求。虽然已发布的神经网络可供任何人用于这些物联网端点,但它们并未针对这些需求进行优先级排序。使用领先的设计技术优化这些网络可以解决这个问题。

除了使用先进的设计方法外,我们在Eta计算中采用的神经网络优化方法还集中在我们的生产级神经传感器处理器ECM3532上(图3)。它融合了混合多核架构和 CVFS 技术的所有优势。

pYYBAGNJCTqAXtnMAAJ3fsSdaPk243.png

图 3.Eta Compute ECM3532 神经传感器处理器采用混合多核架构,其中 Arm Cortex-M3 处理器、恩智浦 CoolFlux DSP、512KB 闪存、352KB SRAM 和支持外设集成在 SoC 中,可实现在 mW 范围内的极端边缘进行推理。

获得的知识

图4所示的测试结果表明,为了将深度学习引入嵌入式视觉系统,电力成本不必上升到不可接受的水平。虽然没有一根魔杖可以满足耗电的神经网络的需求,但将MCU能效和DSP优势与网络优化相结合的方法可以帮助应用程序避免仅依靠云计算而导致的安全性,延迟和低效率问题。

poYBAGNJCQaAfc1DAABgSkhPLA0472.png

图 4.在对人员检测模型的测试中,包括摄像头在内的平均系统功率达到5.6mW。对于此测试,速率为每秒 1.3 次推理,但进一步优化应将平均系统功耗降低到 4mW,同时将速率提高到每秒 2 次推理。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • mcu
    mcu
    +关注

    关注

    146

    文章

    16696

    浏览量

    347999
  • 物联网
    +关注

    关注

    2895

    文章

    43491

    浏览量

    366917
  • 机器视觉
    +关注

    关注

    161

    文章

    4272

    浏览量

    119590
收藏 人收藏

    评论

    相关推荐

    机器视觉的应用范围

    广泛,为人类社会的发展带来了巨大的便利。本文将详细介绍机器视觉的应用范围,包括工业自动化、无人驾驶、医疗健康、家庭服务、安防监控、农业、环境监测等多个方面。 一、工业自动化 机器
    的头像 发表于 07-04 11:33 302次阅读

    芯品# 联网市场性能最高的 NPU

    随着人工智能 (AI) 在我们的日常生活中继续发挥更大的影响力和影响,该领域正在从基于云的推理迁移到边缘和端点推理。基于边缘的推理为各种
    的头像 发表于 06-26 17:28 3173次阅读
    芯品# <b class='flag-5'>物</b><b class='flag-5'>联网</b>市场性能最高的 NPU

    基于FPGA EtherCAT的六自由度机器视觉伺服控制设计

    ,为工业自动化提供了一套切实可行的方案。 本文针对基于机器视觉的工业机器人进行研究,主要工作包括以下几点: (1)设计了基于 伊瑟特的六自由度
    发表于 05-29 16:17

    Microsoft Copilot for Security(国际版)将于4月1日在全球范围内正式发布

    今天,我们很高兴地宣布,Microsoft Copilot for Security (国际版) 将于 4 月 1 日在全球范围内正式发布。
    的头像 发表于 03-14 09:11 563次阅读

    PLC与联网网关的通信协议如何选择数据采集系统

    随着联网技术的发展,企业数字化越来越普及,通过联网网关实现PLC数据采集的应用越来越多,能够帮助提供生产力与管理效率,为生产制造带来切实可行
    的头像 发表于 02-22 15:27 477次阅读
    PLC与<b class='flag-5'>物</b><b class='flag-5'>联网</b>网关的通信协议如何选择数据采集系统

    在英特尔独立显卡上加速HALCON AI模型推理

    MVTec HALCON 是一款在全球范围内使用,综合性的机器视觉标准软件。它有一个专门的集成开发环境(HDevelop),专门用于开发图像处理解决方案。
    的头像 发表于 12-16 10:18 1237次阅读
    在英特尔独立显卡上加速HALCON AI模型<b class='flag-5'>推理</b>

    压电发声器驱动器如何在更宽广的电池电压范围内提高声压级

    压电发声器驱动器如何在更宽广的电池电压范围内提高声压级
    的头像 发表于 12-06 15:08 333次阅读
    压电发声器驱动器如何在更宽广的电池电压<b class='flag-5'>范围内</b>提高声压级

    机器视觉双目测宽仪具体有什么优势?

    、标称宽度、正负公差等;统计的最大、最小宽度及其对应的长度等;测量时显示宽度尺寸波动曲线。当测量数据处于设定的合格范围内时,测量值的数据颜色为绿色;当测量最大厚度偏差超出设定的允许范围时为红色。 产品
    发表于 11-28 17:13

    压电发声器驱动器如何在更宽的电池电压范围内提高声压级?

    压电发声器驱动器如何在更宽的电池电压范围内提高声压级? 压电发声器驱动器是一种常见的声音产生设备,其通过施加电压于压电材料上来产生声音。在实际应用中,我们常常需要在一个宽电压范围内提高压电发声器
    的头像 发表于 11-24 14:20 633次阅读

    工业4.0:让承诺切实可行

    电子发烧友网站提供《工业4.0:让承诺切实可行.pdf》资料免费下载
    发表于 11-22 16:02 0次下载
    工业4.0:让承诺<b class='flag-5'>切实可行</b>

    全工作频率范围内的运放共模抑制比如何测试?

    全工作频率范围内的运放共模抑制比如何测试?
    发表于 11-17 09:17

    AD5521可以设计满足1~2GHz宽范围内的阻抗匹配吗?

    您好! 我的设计是需要满足在1~2GHz的低噪声放大,当我选用了ADL5521后,在ADL5521datasheet发现典型电路做输入匹配时貌似并不能满足在1~2GHz宽范围内的匹配,而是
    发表于 11-17 07:51

    机器视觉里的光学知识科普

    相机芯片尺寸及镜头放大倍率。在实际工程项目中,考虑到机械误差等问题,视场通常要大于待观测物体的实际尺寸,以确保在机械误差的范围内,物体始终位于视觉系统的可视范围内
    的头像 发表于 11-13 16:06 514次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>视觉</b>里的光学知识科普

    为什么接收机中频不能落入调谐范围内

    为什么接收机中频不能落入调谐范围内? 为了更好地理解为什么接收机中频不能落入调谐范围内,我们需要先了解中频系统的基本原理和工作方式。 中频系统是指将高频信号通过调频,变成一定的中频信号,再通过中频
    的头像 发表于 10-19 17:21 581次阅读

    MCU是怎么为联网端点设备提高安全性的?

    MCU 是怎么为联网端点设备提高安全性的?
    发表于 10-17 08:53