0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

先进节点上glitch功耗问题

数字芯片实验室 来源:数字芯片实验室 2024-04-15 12:36 次阅读

这个问题在 AI 加速器中尤为严重,修复这个问题需要一些tradeoff。

据估计,一些最先进和最复杂的芯片设计中总功耗的 20% 到 40% 被浪费了。

glitch功耗并不是一个新现象。在先进节点上,glitch功耗问题正变得越来越突出,没有一种解决方案适用于所有芯片或设计类型。

在组合电路中,时钟控制不同状态寄存器的传播。但是,在栅极或导线中经常存在延迟,因此输入不会同时到达栅极。

假设你有一个 AND 或 OR 门,你所有的信号不会同时到达,所以需要有一个允许范围内的稳定时间窗口。输入越多,发生这种情况的概率就越大,浪费的glitch功耗就越多。

这种现象也被称为hazards。hazards是电路中可能产生这种glitch的原因。根据逻辑的类型,如果存在非常宽的扇入逻辑,或者非常长深度的组合逻辑,那么这些glitch发生的可能性就更高。glitch是非常高频率的东西,它们toggle,然后几乎立即关闭,这种情况可能在任何地方发生多次。

AI 加速器中的glitch

对于 AI 加速器来说,这个问题尤其麻烦,因为 AI 加速器旨在以最小的功耗实现最大的性能。

神经网络处理硬件中,有很多乘法累加计算。事实上,许多神经网络处理器的评级标准是每秒执行数以百万计的MAC,这是性能的衡量标准。但是,如果你看一下硬件乘法器和加法器的传统设计,并且这些类型的电路串联在一起,并采用流水线连接。发生的情况是,即使在单个时钟周期内,也发生了很多这些信号转换。由于不同电路的不同延迟,最终稳定下来,得出最终结果。

由于电路的设计方式,这些神经网络处理器中的乘法器非常容易出现glitch功耗,并且需要多次转换才能稳定到最终结果。

b70da6b8-fa14-11ee-a297-92fbcf53809c.png

glitch源识别和排序

整体效率
Glitch 也会影响设计的整体效率。当你切换某些东西时,它使用来自电压源的能量,一直到引脚,但也使用存储在网络电容中的能量。因此,如果你像这样打开和关闭,你就会不必要地充电和放电这些电容器

由于 RC 延迟增加,先进工艺使情况变得更糟。在先进节点中,晶体管越来越小,延迟开始由RC部分主导。当进入越来越先进的节点时,这些小晶体管必须驱动这些大负载,信号延迟和变化的机会就越多。

如果在线路中存在hazards,就会增加发生glitch的可能性。由于两个输入信号的到达时间不同,因此出现了输出glitch。

很多时候这个glitch的传播实际上影响更大,对于芯片设计师来说,更令人担忧的是它的下游影响,因为这种glitch不仅仅停留在那个信号上。这就是事情变得非常复杂的地方。很多时候它可以向下游传播,因为组合逻辑是多级的。如今,数据路径更深,时钟频率更快。数据路径可以深达 15 或 20 级,该信号的glitch可以一直传播,并导致它通过的每个栅极的功耗浪费。

过去,对glitch功耗的担忧并不多,因为它在总动态功耗中占比不大。但是,我们开始在7nm左右看到的情况,组合逻辑路径开始变得如此之深,以至于glitch功耗成为一个大问题。突然之间,在某些设计中,它占总动态功耗的 25% 到 40%。

审核编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19091

    浏览量

    228776
  • 神经网络
    +关注

    关注

    42

    文章

    4733

    浏览量

    100410
  • AI加速器
    +关注

    关注

    1

    文章

    67

    浏览量

    8623

原文标题:glitch功耗的问题在先进节点上更加突出

文章出处:【微信号:数字芯片实验室,微信公众号:数字芯片实验室】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一文读懂蓝牙网状网络什么是“友邻节点”与低功耗

    蓝牙低功耗(BluetoothLE)是世界功率最高的短距离无线通信技术之一。其低功耗被开发商和消费者广泛赞誉。随着蓝牙网状网络(Mesh)的发布,开发人员可能会想知道蓝牙网格是否也被设计为低
    的头像 发表于 11-12 09:19 7384次阅读

    基于OMAP的低功耗节点处理器该如何去设计?

    如何满足传感网节点功耗和高处理能力间的平衡关系?基于OMAP的低功耗节点处理器该如何去设计?
    发表于 05-20 06:50

    如何在低功耗Bluetooth® PEPS系统中添加CAN节点

    通过使用通信总线进行通信。 图 1:车内的低功耗蓝牙 PEPS 架构卫星节点内部那么卫星节点内部是什么?图 2 所示为低功耗蓝牙卫星模块的典型方框图。该模块有一个低
    发表于 11-09 08:13

    用于油管检漏的WSNs节点功耗设计

    传感器节点一般采用能量有限的电池供电,因此节点功耗问题一直是制约无线传感器网络应用的瓶颈之一。本文设计了一种用于油管检漏的传感器节点,在大量的实验基础
    发表于 01-18 14:17 20次下载

    在40-nm工艺节点实现世界先进的定制逻辑器件

    在40-nm工艺节点实现世界先进的定制逻辑器件 引言   Altera于2008年第二季度推出Stratix® IV和HardCopy® IV器件系列标志着世界上首款40-nm FPGA和业界唯一40-
    发表于 02-04 11:08 1387次阅读
    在40-nm工艺<b class='flag-5'>节点</b>实现世界<b class='flag-5'>上</b>最<b class='flag-5'>先进</b>的定制逻辑器件

    电机温度监测系统低功耗无线节点模块设计

    电机温度监测系统低功耗无线节点模块设计
    发表于 09-25 09:08 5次下载
    电机温度监测系统低<b class='flag-5'>功耗</b>无线<b class='flag-5'>节点</b>模块设计

    电机温度监测系统低功耗无线节点的模块设计

    电机温度监测系统低功耗无线节点的模块设计
    发表于 09-26 08:28 4次下载
    电机温度监测系统低<b class='flag-5'>功耗</b>无线<b class='flag-5'>节点</b>的模块设计

    详细介绍一种显著降低LoRa节点功耗的方法

    对于LoRa节点而言,功耗是极其重要的参数。由于LoRa节点往往安装的范围比较广,比如在农场里安装的温湿度传感器LoRa节点,覆盖整个农场,有可能数量较大,如果
    发表于 10-26 15:21 1977次阅读

    先进工艺节点下的芯片设计需考虑更多变量

    性能、功耗和面积 (PPA) 目标受多个静态指标影响,包括时钟和数据路径时序、版图规划以及特定电压水平下的功耗。这些指标会进一步推动技术库的表征,设计优化和签核收敛。 先进工艺节点设计
    的头像 发表于 05-06 11:12 2112次阅读

    功耗无线传感器网络节点设计与实现

    功耗无线传感器网络节点设计与实现
    发表于 06-23 11:26 17次下载

    5nm及更先进节点FinFET的未来

    虽然栅极间距(GP)和鳍片间距(FP)的微缩持续为FinFET平台带来更高的性能和更低的功耗,但在5nm及更先进节点,兼顾寄生电容电阻的控制和实现更高的晶体管性能变得更具挑战。
    的头像 发表于 05-05 16:00 1556次阅读
    5nm及更<b class='flag-5'>先进</b><b class='flag-5'>节点</b><b class='flag-5'>上</b>FinFET的未来

    5nm及更先进节点FinFET的未来:使用工艺和电路仿真来预测

    虽然栅极间距(GP)和鳍片间距(FP)的微缩持续为FinFET平台带来更高的性能和更低的功耗,但在5nm及更先进节点,兼顾寄生电容电阻的控制和实现更高的晶体管性能变得更具挑战。
    发表于 05-27 17:24 6次下载

    在低功耗 Bluetooth® PEPS 系统中添加 CAN 节点

    在低功耗 Bluetooth® PEPS 系统中添加 CAN 节点
    发表于 10-31 08:24 1次下载
    在低<b class='flag-5'>功耗</b> Bluetooth® PEPS 系统中添加 CAN <b class='flag-5'>节点</b>

    美光正式出货全球最先进的 1β技术节点DRAM

    β DRAM 产品已开始向部分智能手机制造商和芯片平台合作伙伴送样以进行验证,并做好了量产准备。美光率先在低功耗 LPDDR5X 移动内存采用该新一代制程技术,其最高速率可达每秒 8.5Gb。该节点在性能、密度和能效方面都有显
    发表于 11-02 11:50 1372次阅读

    美光出货全球最先进的1β技术节点DRAM

    β DRAM产品已开始向部分智能手机制造商和芯片平台合作伙伴送样以进行验证,并做好了量产准备。美光率先在低功耗LPDDR5X移动内存采用该新一代制程技术,其最高速率可达每秒8.5Gb。该节点在性能
    的头像 发表于 11-02 17:27 932次阅读