0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

芯片设计挑战:SRAM缩放速度变慢

半导体产业纵横 来源:半导体产业纵横 2022-12-22 12:28 次阅读

如果 SRAM 缩放不可行,未来的芯片性能可能会受到阻碍。

几乎所有处理器都依赖某种形式的 SRAM 缓存。缓存作为一种高速存储解决方案,由于其紧邻处理核心的战略位置,访问时间非常快。拥有快速且可访问的存储可以显着提高处理性能,并减少核心工作所浪费的时间。 在第 68 届年度 IEEE 国际 EDM 会议上,台积电揭示了 SRAM 缩放方面的巨大问题。该公司正在为 2023 年开发的下一个节点 N3B 将包括与其前身 N5 相同的 SRAM 晶体管密度,后者用于 AMD 的Ryzen 7000 系列等 CPU 。 目前正在为 2024 年开发的另一个节点 N3E 并没有好多少,其 SRAM 晶体管尺寸仅减少了 5%。

3df5e91e-7dfd-11ed-8abf-dac502259ad0.png

根据 WikiChip 的一份报告,讨论了半导体行业中 SRAM 收缩问题的严重性。台积电的 SRAM Scaling 已经大幅放缓。台积电报告说,尽管逻辑晶体管密度继续缩小,但其 SRAM 晶体管的缩放比例已经完全趋于平稳,以至于 SRAM 缓存在多个节点上保持相同的大小。它会迫使处理器 SRAM 缓存在微芯片芯片上占用更多空间。这反过来可能会增加芯片的制造成本,并阻止某些微芯片架构变得尽可能小。 对于未来的 CPU、GPU 和 SoC 来说,这是一个主要问题,由于 SRAM 单元面积缩放缓慢,它们可能会变得更加昂贵。

SRAM 缩放速度变慢

台积电在今年早些时候正式推出其 N3 制造技术时表示,与其 N5(5 纳米级)工艺相比,新节点的逻辑密度将提高 1.6 倍和 1.7 倍。它没有透露的是,与 N5 相比,新技术的 SRAM 单元几乎无法缩放。根据 WikiChip,它从台积电在国际电子设备会议 (IEDM) 上发表的一篇论文中获得信息TSMC 的 N3 具有 0.0199µm² 的 SRAM 位单元尺寸,与 N5 的 0.021µm²SRAM 位单元相比仅小约 5%。改进后的 N3E 变得更糟,因为它配备了 0.021 µm² SRAM 位单元(大致相当于 31.8 Mib/mm²),这意味着与 N5 相比根本没有缩放。 同时,英特尔Intel 4(最初称为 7nm EUV)将 SRAM 位单元大小从 0.0312µm² 减少到 0.024µm²,对于 Intel 7(以前称为 10nm Enhanced SuperFin),我们仍在谈论 27.8 Mib/mm ²,这有点落后于 TSMC 的 HD SRAM 密度。 此外, WikiChip 回忆起 Imec 的演示文稿,该演示文稿显示在带有分支晶体管的“超过 2nm 节点”上的 SRAM 密度约为 60 Mib/mm²。这种工艺技术还需要数年时间,从现在到那时,芯片设计人员将不得不开发具有英特尔和台积电宣传的 SRAM 密度的处理器。

现代芯片中的 SRAM 负载

现代 CPU、GPU 和 SoC 在处理大量数据时将大量 SRAM 用于各种缓存,从内存中获取数据效率极低,尤其是对于各种人工智能 (AI) 和机器学习 (ML) 工作负载。但是现在即使是智能手机的通用处理器、图形芯片和应用处理器也带有巨大的缓存:AMD 的 Ryzen 9 7950X 总共带有 81MB 的缓存,而 Nvidia 的 AD102 使用至少 123MB 的 SRAM 用于 Nvidia 公开披露的各种缓存。 展望未来,对缓存和 SRAM 的需求只会增加,但对于 N3(将仅用于少数产品)和 N3E,将无法减少 SRAM 占用的裸片面积并降低新的更高成本节点与 N5 相比。从本质上讲,这意味着高性能处理器的裸片尺寸将会增加,它们的成本也会增加。同时,就像逻辑单元一样,SRAM 单元也容易出现缺陷。在某种程度上,芯片设计人员将能够通过 N3 的 FinFlex 创新(在一个块中混合和匹配不同种类的 FinFET 以优化其性能、功率或面积)来减轻更大的 SRAM 单元。 台积电计划推出其密度优化的 N3S 工艺技术,与 N5 相比,该技术有望缩小 SRAM 位单元的尺寸,但这将在 2024 年左右发生,我们想知道这是否会为 AMD、Apple 设计的芯片提供足够的逻辑性能,英伟达高通

缓解措施

在成本方面缓解 SRAM 区域扩展放缓的方法之一是采用多小芯片设计,并将较大的缓存分解为在更便宜的节点上制造的单独裸片。这是 AMD 对其 3D V-Cache 所做的事情,尽管原因略有不同。另一种方法是使用替代内存技术,如 eDRAM 或 FeRAM 用于缓存,尽管后者有其自身的特点。 无论如何,在未来几年,基于 FinFET 节点的 3nm 及更高节点的 SRAM 缩放速度放缓似乎是芯片设计人员面临的主要挑战。

编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 台积电
    +关注

    关注

    43

    文章

    5594

    浏览量

    165947
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10795

    浏览量

    210701
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4663

    浏览量

    128539
  • sram
    +关注

    关注

    6

    文章

    761

    浏览量

    114584

原文标题:停止SRAM微缩,意味着更昂贵的CPU和GPU

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    使用功率缩放

    电子发烧友网站提供《使用功率缩放库.pdf》资料免费下载
    发表于 10-18 10:24 0次下载
    使用功率<b class='flag-5'>缩放</b>库

    电机速度变慢跟什么有关联

    本文旨在探讨电机速度变慢的原因,以及如何通过分析和解决这些问题来提高电机的性能。我们将从电机的基本原理、电气系统、机械系统、环境因素等多个方面进行详细分析。 一、引言 电机作为现代工业和日常生活中
    的头像 发表于 06-05 11:21 1159次阅读

    stm8s003/stm8s005单片机控制的电机,当电机转起来时,用手一捏住光感线,电机速度变慢了或是停下,为什么?

    我最近遇到一个问题,很奇怪,也很难解释。我采用的stm8s003 stm8s005单片机控制的电机,用于跑步机方面的。电机的速度反馈采用的是光感,当电机转起来时,我用手一捏住光感线,电机速度变慢
    发表于 05-08 08:13

    STM32L492 DMA多通道复用后速度变慢是什么原因导致的?

    ,现将UART1由中断改为DMA方式,占用了DMA2 6/7通道.结果问题来了, ADC刷新变慢,UART1也经常丢包。个人感觉DMA2在这里是个瓶颈, 在多通道复用上可能有些问题没考虑到。请问哪位在DMA上有类似经验?
    发表于 04-29 07:12

    STM32F103定时器变慢的原因?怎么解决?

    STM32F103 利用定时器设置按键带长按功能和短按键,按键按键是系统关机,短按只是控制led亮灭。但是有时总会出现长按按键变成了控制led,长按时间也足够的长,在观察led的亮灭的频率也变慢,是时钟频率变慢了?最后不能关机只能复位或重新烧录了。
    发表于 04-23 06:52

    Microchip推出容量更大、速度更快的串行SRAM产品线

    /SQI)的速度提高到143MHz。新产品线包括提供2Mb和4Mb两种不同容量的器件,旨在为传统的并行SRAM产品提供成本更低的替代方案,并在SRAM存储器中包含可
    的头像 发表于 04-12 08:23 343次阅读
    Microchip推出容量更大、<b class='flag-5'>速度</b>更快的串行<b class='flag-5'>SRAM</b>产品线

    先进工艺下的SRAM功耗和性能挑战

    随着AI设计对内部存储器访问的要求越来越高,SRAM在工艺节点迁移中进一步增加功耗已成为一个的问题。
    发表于 04-09 10:17 920次阅读

    STM32上电启动后,会有几率出现程序运行速度变慢的现象,是为什么?

    大家好: 请教个问题,我上电启动后,会有几率出现程序运行速度变慢的现象,比如定时器1s闪烁一次灯,变成了5s闪烁一次。重新上电或软复位后正常。 感觉是启动时,STM32有几率出现时钟没配置正确
    发表于 04-08 07:47

    Microchip推出容量更大、速度更快的串行 SRAM产品线

    Technology(微芯科技公司)扩展了旗下 串行 SRAM 产品线,容量最高可达4 Mb,并将串行外设接口/串行四通道输入/输出接口(SPI/SQI™)的速度提高到143 MHz。新产品线包括提供2 Mb和4
    发表于 04-03 15:24 1130次阅读

    赛普拉斯的NV-SRAM接口解决方案

    赛普拉斯的NV-SRAM将标准快速SRAM单元(访问时间高达20 ns)与基于硅氧化物和亚硝酸盐,氧化物硅(SONOS)的非易失性存储元件相结合,可提供快速的异步读写访问速度,并在其整个工作范围内具有20年的数据保留。
    的头像 发表于 01-09 10:54 532次阅读
    赛普拉斯的NV-<b class='flag-5'>SRAM</b>接口解决方案

    sram读写电路设计

    SRAM (Static Random Access Memory)是一种高速、随机访问的存储器,它以其快速的读写操作和不需要刷新的特点而受到广泛使用。本文将详细介绍SRAM的读写电路设计,从
    的头像 发表于 12-18 11:22 1817次阅读

    关于AI和SRAM的不确定未来思考

    的设计缩小更多尺寸。然而,当我们转向更小尺寸的节点时,保持这种区别变得越来越具有挑战性。现在,SRAM 正在遵循越来越多的逻辑设计规则,并且与基于逻辑晶体管的设计相比,进一步缩小存储器的优势并不明显。
    发表于 12-15 09:43 417次阅读

    SiC – 速度挑战

    SiC – 速度挑战
    的头像 发表于 12-04 16:46 361次阅读
    SiC – <b class='flag-5'>速度</b><b class='flag-5'>挑战</b>

    机器人梯形加减速轨迹时间缩放

    时间缩放即可,整个流程计算量很少。 下面给出不同参数下的几个算例,实现代码在本文末尾。 算例1 有匀速段,位置与姿态位移量相差不大。 %位置梯形参数 vs = 10;%起步速度 vmax = 50;%最大速度 ve = 20;%
    的头像 发表于 11-10 16:56 520次阅读
    机器人梯形加减速轨迹时间<b class='flag-5'>缩放</b>

    机器人时间缩放法原理

    时间缩放法的初衷是用于修改轨迹,避免轨迹违反系统饱和约束限制的,我们先阐述其原理,然后将其用于实现速度曲线时间同步。 在一些应用场景中需要考虑驱动系统的饱和限制约束,为了保证规划的期望轨迹不违反此类
    的头像 发表于 11-10 16:50 417次阅读
    机器人时间<b class='flag-5'>缩放</b>法原理