0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

边缘的超低功耗关键短语检测

星星科技指导员 来源:嵌入式计算设计 作者:Hussein Osman 2022-10-13 10:47 1005次阅读

语音在与智能手机、平板电脑和个人辅助系统交互的广泛使用,使语音成为其他技术的首选HMI(人机界面)。例如,在当今的智能家居中,用户可以要求Alexa打开或关闭灯,锁门和调节恒温器。随着这项技术变得越来越普遍,人们越来越需要使用高度准确、紧凑和高能效的基于神经网络的关键短语检测解决方案来增加人与机器之间的交互的技术解决方案。与需要网络连接的云连接神经网络 (NN) 关键短语检测实现不同,基于边缘的解决方案在边缘执行所有计算,并且不会记录数据或将数据传输到云。

本文将介绍一种专为网络边缘设计的基于NN的关键短语检测解决方案。这些二值化型号可在低功耗超增强™ FPGA 上运行。本文将讨论当使用包含嘈杂背景(如音乐或聊天噪音)的数据集训练 NN 时,如何在嘈杂环境中使用关键短语检测。在这种情况下,神经网络是使用公共数据集来检测单词“seven”的训练。关键短语检测可用于各种应用,无需个人助理设备。可能的应用包括智能电灯开关、智能电视和使用调高和调低音量等命令管理设备的 AVR。

一、引言

长期以来,使用语音命令来控制人机界面(HMI)一直是系统设计人员的目标。可追溯到20世纪中叶的流行科幻电视节目和电影,如“星际迷航”和“星球大战”,给了我们一个声音世界可能是什么样子的暗示。但是,事实证明,为现实生活中的消费类应用开发低成本、高能效的解决方案是难以捉摸的。

然而,在过去几年中,亚马逊的Alexa和苹果的Siri等流行的AI应用程序的出现以及它们将语音命令转换为系统操作的能力加速了向基于语音的HMI的迁移。这些快速的进步为依赖关键短语检测的智能家居解决方案打开了大门。如今,用户可以要求Alexa通过互联网订购产品,打开灯,锁门,设置家庭恒温器,甚至给草地浇水。

通常,这些支持语音的 HMI 执行识别云中关键短语所需的计算。在许多情况下,设计人员将他们的应用程序插入到像亚马逊的Alexa这样的预先存在的基础设施中。但是,这种发展战略面临几个限制。首先是成本。在云中的服务器上运行关键短语检测算法的解决方案必须在每次访问云中的资源时按分钟付费。此外,构建基于云的边缘解决方案的开发人员必须向 NRE 支付费用,以针对特定设备训练其解决方案,然后为他们发布的每个解决方案支付版税。将设计插入预先存在的基础设施的设计人员将看到他们的成本上升,因为他们转向Wi-Fi模型,该模型需要更强大的处理器来获取数据,分析数据,将其发送到边缘设备,并通过Wi-Fi收听命令。

此外,依赖互联网连接会带来额外的风险。如果连接中断,使用互联网连接将数据传输到云可能会导致服务中断。通过互联网传输数据也会带来潜在的黑客攻击风险。从用户的角度来看,互联网连接为侵犯隐私和安全问题打开了大门。依赖于直接位于设备上的计算资源的边缘解决方案可避免这些潜在问题。

二、新方法

本文探讨了一种不同的方法,可为位于网络边缘的设备提供低成本的关键短语检测。利用在开发高度准确、紧凑和低成本的二值化神经网络(NN)模型方面取得的进展,以及新一代极低功耗现场可编程门阵列(FPGA)的改进,设计人员现在可以构建关键短语检测解决方案,在边缘执行所有计算,从而消除与云连接的NN关键短语检测实现相关的连接性、安全性和隐私问题。

通过在本地执行关键短语检测,与基于云的解决方案相比,此设计策略可显著节省成本。它也不依赖于其他生态系统来运行。如果基于云的解决方案中的互联网连接失败,则系统将失败。基于边缘的本地解决方案不会冒此风险。安全和隐私问题不是威胁。本地解决方案更易于用户设置和运行。最后,使用莱迪思的超低功耗iCE40 Ultra Plus FPGA,这种方法为设计人员提供了显著的省电功能,这是电池供电器件中的一个重要考虑因素。例如,本演示中描述的解决方案仅消耗7 mW。

将经济实惠的智能家居应用推向边缘的一个关键步骤是开发能够在低密度、低功耗FPGA上运行的二值化NN模型。在云中使用浮点计算的深度学习技术对于边缘的消费者应用程序是不切实际的。相反,设计人员必须开发计算效率高的解决方案,既要满足精度目标,又要符合消费市场的成本、尺寸和功耗限制。因此,在边缘操作的设计人员必须使用尽可能少的位的数学。

设计人员可以简化计算的一种方法是从浮点数切换到定点数甚至基本整数。通过补偿浮点到定点整数的量化,使用二值化NN的设计人员可以开发出训练速度更快、精度更高的解决方案,并提高定点、低精度整数NN的性能,接近浮点版本的水平。要构建简单的边缘设备,训练必须创建具有 1 位权重的 NN 模型。这些模型称为二值化神经网络 (BNN)。

通过使用 1 位值而不是较大的数字,BNN 可以消除乘法和除法的使用。这允许使用异或和爆裂计数计算卷积,从而产生显着的成本和高达16倍的节能。借助当今的 FPGA,设计人员拥有了一个高度灵活的平台,可提供他们所需的所有内存、逻辑和 DSP 资源。

三、国家实施

下面的讨论描述了一个关键短语检测解决方案的示例,该解决方案专为边缘应用而设计,并在具有BNN软核的iCE40 UltraPlus FPGA中实现。在正常操作期间,关键短语检测实现在功耗低于 1mW 的情况下侦听声音。一旦系统检测到声音,它就会激活 1 秒的缓冲,并调用 BNN。BNN直接在原始输入上运行,而不是在传统的频谱图和MFCC预处理上工作。代表 1 秒音频的 16K 原始样本经过重叠的 1D 卷积层,变成 30 张 32x32x3 图像,每张图像代表一个 10 毫秒的音频样本。然后将输出传递到主 BNN 进行处理。

pYYBAGNHfGeAHtCeAAH8pZmH_Pc973.png

BNN有四层深,每层执行如下图所示的功能:

poYBAGNHfG-ATR0rAAHVk4VXU9c885.png

二进制卷积是输入数据和 1 位权重的 1 位乘法。在这种情况下,乘法被异或函数所取代。批量规范化和缩放使激活规范化,并在 BNN 训练阶段提供帮助。整流线性单元 (ReLu) 将低于特定阈值的数据设置为 0,高于相同阈值的数据设置为 1。对图像的相邻像素的每个像素执行池化,并选择概率最高的有意义像素。此函数可减少后续步骤中所需的计算量。全连接层通常是最后一层,它需要前一层中的每个神经元。它对下一层的神经元也有一定的权重。此函数的计算成本通常很高,因此它是作为神经元明显较少的最后一次操作执行的。

BNN使用GPU进行训练,并运行标准训练工具,如咖啡馆和张量流。使用的训练数据集是一个公共训练集,其中包含 65,000 个一秒长的话语,其中包含 1000 多人的 30 个短词。此阶段称为训练阶段。然后,训练工具的输出通过莱迪思半导体的NN编译器工具进行格式化,以供FPGA设计使用。您可以将权重视为在边缘硬件推理期间要使用的关键短语的模板。选择的关键短语是“七”。

四、系统实施

为了演示系统的功能,工程师们将 HiMax HM01B0 UPduino 扩展板与 iCE40 超增强型 FPGA 配合使用。这是一款低成本的 Arduino 板块,旨在演示 FPGA 的功能。该板有两个直接连接到 FPGA 的 I2S 麦克风、用于 FPGA 设计的外部闪存和权重激活存储。它还具有LED,用于指示关键短语的检测。用户可以直接对着麦克风讲话。一旦检测到关键短语,LED就会亮起。

poYBAGNHfHiABEdrAAEX7USdC0U252.png

五、性能

在此应用中,FPGA设计频率和处理长度可以换取功耗。在 27MHz 频率下,16K 原始采样(相当于 1 秒的音频处理)可在 25ms 内处理,而功耗为 7.7mW。当频率降至13.5MHz时,功耗降至4.2mW,并在50ms内处理相同的1秒音频样本。

关键短语检测通常必须在嘈杂的环境中运行,而无需添加额外的硬件来消除噪声和回声。该实现通过使用包含噪声背景的数据集来训练 NN 来实现这一目标,而无需进行定位和波束成形。经过训练的NN像人类一样检测关键词,具有类似的局限性。添加了具有各种随机人群噪音水平(咖啡馆,会议等)的数据集,并带有关键短语。使用更高噪声级别训练的 NN 对噪声的鲁棒性更强,但需要更响亮的关键短语。

BNN 可以检测多达 10 个 1 秒的关键短语,使其成为通过语音进行 HMI 的理想选择。为了提高检测精度,仅当发生连续检测时,才使用时域滤波器来报告关键短语检测。该设计为单个关键短语提供高达 99% 的准确率,为多达 5 个关键短语提供高达 90% 的准确率。

六、结语

将AI带到边缘会带来几个重大挑战。但是,它也提供了巨大的机会。正如该项目所表明的那样,使用实现BNN而不是基于云的资源的FPGA将AI构建到设备中可以显着降低硬件成本,同时加快响应时间。同时

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能手机
    +关注

    关注

    66

    文章

    18596

    浏览量

    182760
  • HMI
    HMI
    +关注

    关注

    9

    文章

    623

    浏览量

    49567
收藏 人收藏
    相关推荐
    热点推荐

    低功耗语音唤醒IC

    。§语音触发启动装置§支持感官和大讯飞的语音触发和关键短语检测软件§所有数字操作的低功耗§特别低功耗的语音/声音
    发表于 01-15 12:15

    超低功耗FPGA解决方案助力机器学习

    IoT应用。通过提供结合了灵活、超低功耗FPGA硬件和软件解决方案、功能全面的机器学习推理技术,Lattice sensAI将加速网络边缘设备上传感器数据处理和分析的集成。这些新的网络边缘计算解决方案
    发表于 05-23 15:31

    精密超低功耗高端电流检测

    DN1045- 精密超低功耗高端电流检测
    发表于 06-17 11:07

    超低功耗MCU选型与设计

      循序渐进式的功耗优化已经不再是超低功耗mcu的游戏规则,而是“突飞猛进”模式,与功耗相关的很多指标都不断刷新记录。我们在选择合适的超低功耗mcu时要掌握必要的技巧,在应用时还需要一
    发表于 07-29 07:27

    如何选择超低功耗MCU

    在物联网的推动下,业界对各种电池供电设备产生了巨大需求。这反过来又使业界对微控制器和其他系统级器件的能源效率要求不断提高。因此超低功耗MCU与功耗相关的很多指标都不断得刷新记录。在选择合适的超低功耗
    发表于 12-28 07:12

    如何选择超低功耗MCU

    在物联网的推动下,业界对各种电池供电设备产生了巨大需求。这反过来又使业界对微控制器和其他系统级器件的能源效率要求不断提高。因此超低功耗MCU与功耗相关的很多指标都不断得刷新记录。在选择合适的超低功耗
    发表于 11-04 07:07

    对STM32的超低功耗使用

    一,电源管理库函数前面的入门文章对 STM32 的超低功耗的做了使用介绍,当然在使用超低功耗的时候还会考虑 RAM 的数据会不会丢失,什么时候重写 备份寄存器,进入低功耗模式的时候要怎么保持 IO
    发表于 12-31 06:36

    超低功耗一氧化碳检测仪的解决方案

    描述此参考设计采用毫微功耗运算放大器、比较器、系统计时器、温度传感器和 SimpleLink™ 超低功耗 2.4GHz 无线微控制器 (MCU) 平台,展示了超低功耗一氧化碳检测仪的实
    发表于 09-21 06:20

    超低功耗设计技巧与实现

    超低功耗设计技巧与实现
    发表于 01-18 14:59 105次下载
    <b class='flag-5'>超低功耗</b>设计技巧与实现

    聪明的超低功耗设计

    你熟悉的基本方法的低功耗设计。现在,你怎么把它带到一个新水平?极端的低功耗嵌入式设计需要仔细选取工具缓存,电路设计和智能利用单片机超低功耗的特点。
    发表于 08-04 14:09 13次下载
    聪明的<b class='flag-5'>超低功耗</b>设计

    基于超低功耗设计技巧与实现

    基于超低功耗设计技巧与实现
    发表于 10-15 10:44 12次下载
    基于<b class='flag-5'>超低功耗</b>设计技巧与实现

    基于中文关键短语的自动提取方法综述

    Segphrase算法是当前提取关键短语最新的技术,其提取关键短语的结果比传统方法具有更高的准确率和召回率。但是 Seg Phrase算法在关键
    发表于 05-11 10:41 1次下载

    边缘超低功耗关键短语检测

      BNN 可以检测多达十个 1 秒的关键短语,非常适合通过语音进行 HMI。为了提高检测精度,仅在连续检测发生时才使用时域过滤器来报告
    的头像 发表于 06-24 10:09 2373次阅读
    <b class='flag-5'>边缘</b>的<b class='flag-5'>超低功耗</b><b class='flag-5'>关键</b><b class='flag-5'>短语</b><b class='flag-5'>检测</b>

    智能家庭与超低功耗

    智能家庭与超低功耗
    发表于 11-02 08:16 1次下载
    智能家庭与<b class='flag-5'>超低功耗</b>

    边缘超低功耗关键短语检测

    提高到接近浮点版本的水平。要构建简单的边缘设备,训练必须创建具有 1 位权重的 NN 模型。这些模型被称为二值化神经网络(BNN)。
    的头像 发表于 12-01 15:20 673次阅读
    <b class='flag-5'>边缘</b>的<b class='flag-5'>超低功耗</b><b class='flag-5'>关键</b><b class='flag-5'>短语</b><b class='flag-5'>检测</b>

    史上最全面解析:开关电源各功能电路

    01开关电源的电路组成开关电源的主要电路是由输入电磁干扰滤波器(EMI)、整流滤波电路、功率变换电路、PWM控制器电路、输出整流滤波电路组成。辅助电路有输入过欠压保护电路、输出过欠压保护电路、输出过流保护电路、输出短路保护电路等。开关电源的电路组成方框图如下:02输入电路的原理及常见电路1AC输入整流滤波电路原理①防雷电路:当有雷击,产生高压经电网导入电源时

    张飞实战电子官方
    15小时前
    151

    有几种电平转换电路,适用于不同的场景

    一.起因一般在消费电路的元器件之间,不同的器件IO的电压是不同的,常规的有5V,3.3V,1.8V等。当器件的IO电压一样的时候,比如都是5V,都是3.3V,那么其之间可以直接通讯,比如拉中断,I2Cdata/clk脚双方直接通讯等。当器件的IO电压不一样的时候,就需要进行电平转换,不然无法实现高低电平的变化。二.电平转换电路常见的有几种电平转换电路,适用于

    张飞实战电子官方
    1天前
    296

    瑞萨RA8系列教程 | 基于 RASC 生成 Keil 工程

    对于不习惯用 e2 studio 进行开发的同学,可以借助 RASC 生成 Keil 工程,然后在 Keil 环境下愉快的完成开发任务。

    RA生态工作室
    05-01 10:00
    553

    共赴之约 | 第二十七届中国北京国际科技产业博览会圆满落幕

    作为第二十七届北京科博会的参展方,芯佰微有幸与800余家全球科技同仁共赴「科技引领创享未来」之约!文章来源:北京贸促5月11日下午,第二十七届中国北京国际科技产业博览会圆满落幕。本届北京科博会主题为“科技引领创享未来”,由北京市人民政府主办,北京市贸促会,北京市科委、中关村管委会,北京市经济和信息化局,北京市知识产权局和北辰集团共同承办。5万平方米的展览云集

    芯佰微电子
    1天前
    655

    道生物联与巍泰技术联合发布 RTK 无线定位系统:TurMass™ 技术与厘米级高精度定位的深度融合

    道生物联与巍泰技术联合推出全新一代 RTK 无线定位系统——WTS-100(V3.0 RTK)。该系统以巍泰技术自主研发的 RTK(实时动态载波相位差分)高精度定位技术为核心,深度融合道生物联国产新兴窄带高并发 TurMass™ 无线通信技术,为室外大规模定位场景提供厘米级高精度、广覆盖、高并发、低功耗、低成本的一站式解决方案,助力行业智能化升级。

    道生物联
    1天前
    516

    智能家居中的清凉“智”选,310V无刷吊扇驱动方案--其利天下

    炎炎夏日,如何营造出清凉、舒适且节能的室内环境成为了大众关注的焦点。吊扇作为一种经典的家用电器,以其大风量、长寿命、低能耗等优势,依然是众多家庭的首选。而随着智能控制技术与无刷电机技术的不断进步,吊扇正朝着智能化、高效化、低噪化的方向发展。那么接下来小编将结合目前市面上的指标,详细为大家讲解其利天下有限公司推出的无刷吊扇驱动方案。▲其利天下无刷吊扇驱动方案一

    其利天下技术
    05-10 16:29
    1.5k

    电源入口处防反接电路-汽车电子硬件电路设计

    一、为什么要设计防反接电路电源入口处接线及线束制作一般人为操作,有正极和负极接反的可能性,可能会损坏电源和负载电路;汽车电子产品电性能测试标准ISO16750-2的4.7节包含了电压极性反接测试,汽车电子产品须通过该项测试。二、防反接电路设计1.基础版:二极管串联二极管是最简单的防反接电路,因为电源有电源路径(即正极)和返回路径(即负极,GND),那么用二极

    张飞实战电子官方
    05-09 19:34
    942

    半导体芯片需要做哪些测试

    首先我们需要了解芯片制造环节做⼀款芯片最基本的环节是设计->流片->封装->测试,芯片成本构成⼀般为人力成本20%,流片40%,封装35%,测试5%(对于先进工艺,流片成本可能超过60%)。测试其实是芯片各个环节中最“便宜”的一步,在这个每家公司都喊着“CostDown”的激烈市场中,人力成本逐年攀升,晶圆厂和封装厂都在乙方市场中“叱咤风云”,唯独只有测试显

    汉通达
    05-09 10:02
    883

    解决方案 | 芯佰微赋能示波器:高速ADC、USB控制器和RS232芯片——高性能示波器的秘密武器!

    示波器解决方案总述:示波器是电子技术领域中不可或缺的精密测量仪器,通过直观的波形显示,将电信号随时间的变化转化为可视化图形,使复杂的电子现象变得清晰易懂。无论是在科研探索、工业检测还是通信领域,示波器都发挥着不可替代的作用,帮助工程师和技术人员深入剖析电信号的细节,精准定位问题所在,为创新与发展提供坚实的技术支撑。一、技术瓶颈亟待突破性能指标受限:受模拟前端

    芯佰微电子
    05-09 10:36
    1.6k

    硬件设计基础----运算放大器

    1什么是运算放大器运算放大器(运放)用于调节和放大模拟信号,运放是一个内含多级放大电路的集成器件,如图所示:左图为同相位,Vn端接地或稳定的电平,Vp端电平上升,则输出端Vo电平上升,Vp端电平下降,则输出端Vo电平下降;右图为反相位,Vp端接地或稳定的电平,Vn端电平上升,则输出端Vo电平下降,Vn端电平下降,则输出端Vo电平上升2运算放大器的性质理想运算

    张飞实战电子官方
    05-08 19:34
    617

    ElfBoard技术贴|如何调整eMMC存储分区

    ELF 2开发板基于瑞芯微RK3588高性能处理器设计,拥有四核ARM Cortex-A76与四核ARM Cortex-A55的CPU架构,主频高达2.4GHz,内置6TOPS算力的NPU,这一设计让它能够轻松驾驭多种深度学习框架,高效处理各类复杂的AI任务。

    ElfBoard
    05-08 15:01
    1.2k

    米尔基于MYD-YG2LX系统启动时间优化应用笔记

    1.概述MYD-YG2LX采用瑞萨RZ/G2L作为核心处理器,该处理器搭载双核Cortex-A55@1.2GHz+Cortex-M33@200MHz处理器,其内部集成高性能3D加速引擎Mail-G31GPU(500MHz)和视频处理单元(支持H.264硬件编解码),16位的DDR4-1600/DDR3L-1333内存控制器、千兆以太网控制器、USB、CAN、

    米尔电子
    05-08 08:07
    415

    运放技术——基本电路分析

    虚短和虚断的概念由于运放的电压放大倍数很大,一般通用型运算放大器的开环电压放大倍数都在80dB以上。而运放的输出电压是有限的,一般在10V~14V。因此运放的差模输入电压不足1mV,两输入端近似等电位,相当于“短路”。开环电压放大倍数越大,两输入端的电位越接近相等。“虚短”是指在分析运算放大器处于线性状态时,可把两输入端视为等电位,这一特性称为虚假短路,简称

    张飞实战电子官方
    05-07 19:32
    562

    飞凌嵌入式携手中移物联,谱写全国产化方案新生态

    4月22日,飞凌嵌入式“2025嵌入式及边缘AI技术论坛”在深圳成功举办。中移物联网有限公司(以下简称“中移物联”)携OneOS操作系统与飞凌嵌入式共同推出的工业级核心板亮相会议展区,操作系统产品部高级专家严镭受邀作《OneOS工业操作系统——助力国产化智能制造》主题演讲。

    飞凌嵌入式
    05-07 11:26
    1.7k

    ATA-2022B高压放大器在螺栓松动检测中的应用

    实验名称:ATA-2022B高压放大器在螺栓松动检测中的应用实验方向:超声检测实验设备:ATA-2022B高压放大器、函数信号发生器,压电陶瓷片,数据采集卡,示波器,PC等实验内容:本研究基于振动声调制的螺栓松动检测方法,其中低频泵浦波采用单频信号,而高频探测波采用扫频信号,利用泵浦波和探测波在接触面的振动声调制响应对螺栓的松动程度进行检测。通过螺栓松动检测

    Aigtek安泰电子
    05-06 18:44
    1.1k