0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

并非所有的模拟计算都是平等的

星星科技指导员 来源:嵌入式计算设计 作者:Marcie Weinstein 2022-07-10 11:04 次阅读

随着消费、生物医学和 IoT/IIoT 市场中始终监听设备的爆炸式增长,似乎每个人都在尝试使用模拟来节省设计中的功耗。借助使用“模拟内存计算”来降低处理器功率的新型机器学习 (ML) 数字芯片半导体供应商正在发明新方法来利用模拟计算的固有功率和计算效率。那么,有什么问题呢?事实是,尽管这些芯片利用模拟电路的固有优势来节省芯片内用于神经网络处理的功率,但它们最终是在数字域中对数字数据进行操作的数字处理芯片——这意味着它们只为系统提供有限的节能。幸运的是,模拟ML ) 内核——现在可以在系统级实现更高的功率效率。

虽然模拟内存计算和模拟ML 有时都被标记为“模拟计算”,但它们绝不是一回事。设计人员需要了解模拟内存计算和模拟ML 内核之间的差异,以便他们能够创建更节能的终端设备?

内存模拟计算的芯片级效率

模拟内存计算通常是指在其他数字机器学习处理器的神经网络中使用模拟电路,以便以较低的功率执行乘法累加 (MAC) 功能。但是利用这种方法的芯片仍然是在标准数字处理范式内运行的时钟处理器,需要立即对所有模拟传感器数据进行数字化,无论是否相关。事实上,使用模拟内存计算的芯片实际上需要三个单独的数据转换才能确定数据的重要性。传感器数据立即转换为数字进行初始处理(数字化优先架构),然后将它们转换为芯片内的模拟数据以实现 MAC 功能,最后,它们在芯片内被转换回数字,以进行推理、分类和其他功能所需的额外数字处理。因此,大量的数据转换,但没有太多的实际模拟处理。

虽然模拟内存计算可能会降低单个推理芯片的功率,但它仅以非常有限的方式使用模拟,因此它只能为整个系统提供同样有限的功率降低。

AnalogML 的系统级效率

相比之下,analogML 内核完全在模拟域内运行,不需要时钟,并且在对任何数据进行数字化之前使用原始模拟传感器数据进行推理和分类。集成到始终监听的设备中,analogML 内核在花费任何精力进行单个数据转换之前确定数据的重要性。我们称其为“先分析”,因为analogML 核心保持数字系统关闭,除非检测到相关数据。

与包含模拟内存计算的 ML 芯片相比,analogML 内核处理模拟传感器数据的更简化方法对系统级效率产生重大影响。(见图 1。)

poYBAGLKQeaABv-TAAN5J2XuCvw484.png

图 1:使用具有模拟内存计算的 ML 芯片的数字化优先系统架构(顶部模块)与使用模拟ML 内核的分析优先系统架构(底部模块)的比较

例如,在典型的语音优先系统中,analogML 内核 100% 的时间都处于开启状态,在始终侦听模式下消耗低至 10µA 的电流以确定哪些数据是重要的(分析优先架构),然后再消耗任何功率关于数字化。这会使系统的其余部分保持休眠状态,直到检测到相关数据。与在数字域中 100% 的时间(数字化优先架构)运行并消耗高达 3000-4000µA 的更传统的 ML 芯片相比,使用模拟ML 的分析优先方法可将电池寿命延长多达 10 倍。这就是持续数天而不是数小时的智能耳塞与一次充电即可持续数年而不是数月的声控电视遥控器之间的区别。

AnalogML Core 中有什么?

深入analogML 核心的底层揭示了模拟内存计算(模拟计算仅用于神经网络)与analogML 核心(由多个软件控制的模拟处理块组成,我们可以启用、重新配置)之间的区别,并针对各种分析优先应用程序进行调整。这些模块——可以在需要时独立供电——实现了一系列功能。(见图 2)。

pYYBAGLKQe2ANlTxAAQlRDBIzYQ775.png

图 2:analogML 内核的框图

传感器接口——可以为特定传感器类型(麦克风、加速度计等)合成接口电路

模拟特征提取——从原始的模拟传感器数据中挑选出显着特征,大大减少进入神经网络的数据量

模拟神经网络——高效、小尺寸、可编程模拟推理模块

模拟数据压缩——模拟传感器数据的连续收集和压缩支持低功耗数据缓冲

模拟范式转变

AnalogML 远远超出了在整个 ML 芯片计算的一小部分中使用一点点模拟计算来节省功耗。这是一个完整的模拟前端解决方案,它使用接近零的功率来确定信号链中最早点的数据的重要性——而数据仍然是模拟的——以最大限度地减少通过系统运行的数据量和数字系统 (ADC/MCU/DSP) 开启的时间量。在某些应用中,例如玻璃破碎检测,事件可能每十年发生一次(或从不发生),使用模拟ML 内核使数字系统在 99% 以上的时间内保持关闭可以将电池寿命延长数年。这开辟了新类别的持久远程应用程序,如果所有相关或不相关的数据在处理之前都被数字化,这些应用程序将无法实现。

底线是所有模拟计算都不相等。无论芯片中包含多少模拟处理来降低其功耗,除非该芯片在模拟域中运行,在模拟数据上,它并没有做我们所知道的最能节省系统功耗的一件事——减少数字处理数据。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    455

    文章

    50714

    浏览量

    423145
  • mcu
    mcu
    +关注

    关注

    146

    文章

    17123

    浏览量

    350991
  • adc
    adc
    +关注

    关注

    98

    文章

    6495

    浏览量

    544466
收藏 人收藏

    评论

    相关推荐

    ADS4129在250msps时,是所有的采样都是延迟固定的10个时钟周期吗?是什么原因造成的这种延迟呢?

    上图中的ADC latency是10个时钟周期,那么在250msps时,是所有的采样都是延迟固定的10个时钟周期吗?是什么原因造成的这种延迟呢?
    发表于 12-09 06:28

    XC7A100T板卡设计原理图:297-基于XC7A100T的PCIe千兆电口以太网收发卡

    XCVU13P , 光电脉冲采集处理 , 模拟计算板卡 , 千兆电口以太网收发卡 , XC7A100T板卡
    的头像 发表于 12-02 18:19 147次阅读
    XC7A100T板卡设计原理图:297-基于XC7A100T的PCIe千兆电口以太网收发卡

    模拟计算板卡设计方案:429-基于XC7Z035+ADS5474的2路400Msps AD 光电脉冲采集处理卡

    模拟计算板卡 , XC7Z035板卡 , ADS5474处理板 , 光电脉冲采集处理
    的头像 发表于 11-27 10:04 198次阅读
    <b class='flag-5'>模拟计算</b>板卡设计方案:429-基于XC7Z035+ADS5474的2路400Msps AD 光电脉冲采集处理卡

    光刻工艺中分辨率增强技术详解

    分辨率增强及技术(Resolution Enhancement Technique, RET)实际上就是根据已有的掩膜版设计图形,通过模拟计算确定最佳光照条件,以实现最大共同工艺窗口(Common Process Window),这部分工作一般是在新光刻工艺研发的早期进行
    的头像 发表于 10-18 15:11 508次阅读
    光刻工艺中分辨率增强技术详解

    模拟元件使用热计算工具

    电子发烧友网站提供《对模拟元件使用热计算工具.pdf》资料免费下载
    发表于 10-17 11:34 0次下载
    对<b class='flag-5'>模拟</b>元件使用热<b class='flag-5'>计算</b>工具

    是不是所有的运放都需要偏置回路?

    是不是所有的运放都需要偏置回路,尤其是在多级运放级联的时候需要给每个运放提供偏置回路吗?如果是的话,一般是怎样的电路形式?我只知道在仪器仪表运放中 需要提供偏置回路(INA118/INA128等)
    发表于 09-19 06:03

    并非所有抖动都是相同的:了解开关电源中的抖动

    电子发烧友网站提供《并非所有抖动都是相同的:了解开关电源中的抖动.pdf》资料免费下载
    发表于 08-26 14:24 1次下载
    <b class='flag-5'>并非</b><b class='flag-5'>所有</b>抖动<b class='flag-5'>都是</b>相同的:了解开关电源中的抖动

    为什么所有的光电二极管放大器中的光电二极管都接在运放的负极,都是反向放大?

    为什么所有的光电二极管放大器中的光电二极管都接在运放的负极,都是反向放大;为什么没有接在正极,做同向放大呢?如下图我自己画的那个同向反向放大电路可以用吗?......
    发表于 07-31 06:39

    效果器对所有的专业功放都通用吗

    、电影制作等多个方面。然而,效果器是否对所有的专业功放都通用,这个问题需要从多个角度进行分析。 首先,我们需要了解效果器的分类。根据处理音频信号的方式,效果器可以分为数字效果器和模拟效果器两大类。数字效果器通过数字信号处理技术对音频
    的头像 发表于 07-29 09:53 861次阅读

    存内计算原理分类——数字存内计算模拟存内计算

    数字存内计算模拟存内计算各有优劣,都是存算一体发展进程中的重点发展路径,数字存内计算由于其高速、高精度、抗噪性强、工艺技术成熟、能效比高等
    的头像 发表于 05-21 16:26 2480次阅读
    存内<b class='flag-5'>计算</b>原理分类——数字存内<b class='flag-5'>计算</b>与<b class='flag-5'>模拟</b>存内<b class='flag-5'>计算</b>

    国内企业再获突破 成功掌握8英寸SiC关键技术

    世纪金芯公司采用模拟软件,首先对坩埚、保温层和加热器等组成的热场进行模拟计算,营造符合实际生长过程的温度和温度梯度。
    的头像 发表于 04-15 12:51 723次阅读

    如何利用忆阻器技术改变高精度的科学计算

    当组织成纵横阵列时,这种忆阻电路通过以大规模并行方式使用物理定律进行模拟计算,从而大大加速矩阵运算,这是神经网络中最常用但非常耗电的计算
    发表于 04-03 15:18 685次阅读

    如何在Cubemx中添加所有的外设头文件?

    ,需要自己去添加相应的头文件,但自己添加有时还是会报错,而且是不知原因的报错。 所以,在这向各位开发者、大咖,请教一下,如何在Cubemx中添加所有的外设头文件,或者在配置完cubemx后如何高效的添加自己所需要的外设头文件
    发表于 04-01 07:46

    Exarion芯片公司推出声音追踪计算芯片,与台积电共同生产

    Exarion表示,音效追踪技法相类光合卡GPU使用的光线追踪,通过模拟计算虚拟环境中的音轨及反射,实现逼真音效。此项技术能够分辩来自左右上下的声音,且需进行大规模计算
    的头像 发表于 03-08 15:29 644次阅读

    基于ZYNQ FPGA构建嵌入式的模拟计算板卡

    板卡基于高速400M 采样AD 和ZYNQ FPGA构建嵌入式的模拟计算板卡, 可用于工业雷达,行业雷达的场合。板卡使用工业级芯片。
    的头像 发表于 01-09 11:30 1257次阅读
    基于ZYNQ FPGA构建嵌入式的<b class='flag-5'>模拟计算</b>板卡