0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用于有效使用TinyML的随机计算架构

星星科技指导员 来源:嵌入式计算设计 作者:Abhishek Jadhav 2022-07-11 09:20 次阅读

神经网络是一种流行的机器学习模型,但它们需要更高的能耗和更复杂的硬件设计。随机计算是平衡硬件效率和计算性能之间权衡的一种有效方式。然而,由于算术单元的低数据精度和不准确性,随机计算见证了 ML 工作负载的低准确性。

为了解决与传统随机计算方法相关的问题,并通过更高的精度和更低的功耗来提高性能,正在进行的研究提出了一种改进的基于块的随机计算架构。通过在输入层中引入块,可以通过利用高数据并行性来减少延迟。更重要的是确定全局优化方法所需要的块数。

现有的方法包括增加比特流的长度以提高数据精度,甚至使用指数比特来获得准确的结果。然而,这引入了较长的计算延迟,这对于 TinyML 应用程序来说是不合理的。因此,为了应对这种不断上升的计算延迟,比特流被分成块然后并行执行。结合块内算术单元和输出修正 (OUR) 方案可缓解块间不准确问题,从而提供高计算效率。

基于块的随机计算架构

研究提供了一种新颖的架构,其中输入被划分为块并使用优化的块内算术单元并行执行乘法和加法。此外,在 TinyML 应用程序的延迟-功耗权衡方面,所提出的模型是一个出色的架构。

架构划分如下:

块划分

如上图所示,输入比特流被划分为“k”个值块。所提出的想法是,为比特流选择大量块并不能保证是最佳的,但可以用于接近近似值。如果在选择块数时出现错误,这可能会自相矛盾地导致大错误。在确定来自输入比特流的正和负部分的两个平均值的概率方面存在复杂的计算。

块内计算

缓解了传统加法器面临的OR加法器相关问题和分离加法器溢出问题。新修改的架构设计在输入之间带有 XNOR+AND 门,以消除双极计算的相关性。

每个输入位都在并行计数器 (PC) 中获取,对于正负部分 (Ap, An) 分别进行处理。有两个专用累加器用于处理有符号位。取输入位后,累加器之间发生减法,如正负部分所示。目标是获得所有输入的累积 1 的数量。进一步地,比较取时间输出(Sop,Son)中的一位,在多个“n”个循环之后,计算符号位,并根据符号位Ap和An,选择Sop和Son的输出结果。

这种新的基于累加器的符号幅度格式加法器利用 unNSADD 加法器来比较输出和输入中的实际累加 1 以确定输出位。这种方法消除了相关性和快速溢出问题的影响。

块间​​输出修正方案

尽管块内加法器解决了相关性和溢出问题,但块划分引入了新的块间不准确错误。乘法器不会发生这种情况,因为输入是 XNORed 和 ANDed。但是对于加法器,输出中 1 的数量可能会偏离所产生的不准确性。输出修订方案在并行块内计算阶段之后添加或删除 1s,而不会引入任何额外的延迟来解决这些块间不准确错误。

新颖的基于块的随机计算架构旨在提高随机计算运算电路的精度,同时降低计算延迟和能源效率。根据研究结果,该方法比现有方法的准确度提高了 10% 以上,并节省了 6 倍以上的功率。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4772

    浏览量

    100857
  • 机器学习
    +关注

    关注

    66

    文章

    8422

    浏览量

    132743
收藏 人收藏

    评论

    相关推荐

    ADS1282是32位ADC,在计算对纹波要求的时候,LSB按照32位计算,还是按照有效位数计算

    ADS1282是32位ADC,那么在计算对纹波要求的时候,LSB按照32位计算,还是按照有效位数计算(有效位数才20位)。
    发表于 12-04 08:36

    开源芯片系列讲座第24期:基于SRAM存算的高效计算架构

    鹭岛论坛开源芯片系列讲座第24期「基于SRAM存算的高效计算架构」明晚(27日)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目基于SRAM存算的高效计算架构报告简介
    的头像 发表于 11-27 01:05 261次阅读
    开源芯片系列讲座第24期:基于SRAM存算的高效<b class='flag-5'>计算</b><b class='flag-5'>架构</b>

    ads1256有效位数怎么计算

    您好,对于ADS1256有效位数的计算,数据手册给出的测试公式是怎么推到出来的呢?能够帮我推到出来吗?对于第一张图中rms的计算是怎么出来的?
    发表于 11-22 07:07

    用于MySQL的dbForge架构比较

    dbForge Schema Compare for MySQL 是一种工具,用于轻松有效地比较和部署 MySQL 数据库结构和脚本文件夹差异。该工具提供了 MySQL 数据库架构中所有差异的全面视图。
    的头像 发表于 10-28 09:41 221次阅读
    适<b class='flag-5'>用于</b>MySQL的dbForge<b class='flag-5'>架构</b>比较

    边缘计算架构设计最佳实践

    边缘计算架构设计最佳实践涉及多个方面,以下是一些关键要素和最佳实践建议: 一、核心组件与架构设计 边缘设备与网关 边缘设备 :包括各种嵌入式设备、传感器、智能手机、智能摄像头等,负责采集原始数据
    的头像 发表于 10-24 14:17 456次阅读

    内存储器分为随机存储器和什么

    内存储器是计算机系统中用于临时存储数据和程序的关键部件,它直接影响到计算机的运行速度和性能。内存储器主要分为两大类:随机存储器(RAM,Random Access Memory)和只读
    的头像 发表于 10-14 09:54 1159次阅读

    随机内存储器的特点有哪些

    随机存取存储器(Random Access Memory,简称RAM)是计算机和其他电子设备中用于存储数据的一种半导体存储器。它允许数据在任何时间被读取或写入,因此被称为“随机存取”。
    的头像 发表于 10-14 09:51 550次阅读

    闪存随机读写与连续读写哪个重要

    快速响应的应用中,如数据库操作、服务器处理请求等,随机读写速度至关重要。 多任务处理能力 : 随机读写能力强的闪存能够更有效地处理多个并发任务,因为它们可以更快地访问和修改存储在不同位置的数据。 连续读写的重要性 大数据传输 :
    的头像 发表于 10-12 11:44 493次阅读

    用于控制和保护的HVDC架构和解决方案简介

    电子发烧友网站提供《用于控制和保护的HVDC架构和解决方案简介.pdf》资料免费下载
    发表于 09-04 09:24 0次下载
    <b class='flag-5'>用于</b>控制和保护的HVDC<b class='flag-5'>架构</b>和解决方案简介

    瑞萨电子推出Reality AI Explorer Tier,用于开发AI与TinyML解决方案

    全球半导体解决方案供应商瑞萨电子(TSE:6723)宣布推出Reality AI Explorer Tier——作为Reality AI Tools软件的免费版本,可用于开发工业、汽车和商业应用中的AI与TinyML解决方案。
    的头像 发表于 07-19 10:03 445次阅读

    迅为RK3562核心板四核A53+MaliG52架构,应用于商业平板电脑,视频会议,智能家居,教育电子,医疗设备,边缘计算,工业应用

    迅为RK3562核心板四核A53+MaliG52架构,应用于商业平板电脑,视频会议,智能家居,教育电子,医疗设备,边缘计算,工业应用
    发表于 07-09 10:57

    TinyML在机器人中的应用——创建语音控制机器人子系统

    Pete Warden和哈佛大学TinyML团队开发的Arduino代码。为了在我们的微控制器单元(MCU)上部署,他们的资源将为我们提供: 访问数据集 模型架构 培训脚本 量化脚本 评价工具 Arduino代码 作为免责声明,我们没有开发绝大多数代码,我们不拥有它的权利
    的头像 发表于 05-07 14:51 7667次阅读
    <b class='flag-5'>TinyML</b>在机器人中的应用——创建语音控制机器人子系统

    TinyML计算机视觉正在通过microNPU(µ NPU)变为现实

    无处不在。 有三个主要的技术趋势使这种演变。新的精益神经网络算法适合微型设备的内存空间和计算能力。新的硅架构为神经网络处理提供了比传统微控制器(MCU)高几个数量级的效率。用于较小微处理器的AI框架正在成熟,减少了在边缘开发
    的头像 发表于 05-06 15:50 3566次阅读

    什么是随机森林?随机森林的工作原理

    随机森林使用名为“bagging”的技术,通过数据集和特征的随机自助抽样样本并行构建完整的决策树。虽然决策树基于一组固定的特征,而且经常过拟合,但随机性对森林的成功至关重要。
    发表于 03-18 14:27 3605次阅读
    什么是<b class='flag-5'>随机</b>森林?<b class='flag-5'>随机</b>森林的工作原理

    vivo申请随机接入、配置方法及相关设备专利

    该专利摘要详细阐述了这是一种应用于通讯技术领域的新发明。其创新之处在于,通过对目标随机接入过程中所需的目标信息(如物理上行共享信道PUSC)进行重复传输,从而提升终端在PUSC上行覆盖的能力,有效缩短目标
    的头像 发表于 01-29 09:50 479次阅读
    vivo申请<b class='flag-5'>随机</b>接入、配置方法及相关设备专利