0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

芯片设计挑战:SRAM缩放速度变慢

半导体产业纵横 来源:半导体产业纵横 2022-12-22 12:28 次阅读

如果 SRAM 缩放不可行,未来的芯片性能可能会受到阻碍。

几乎所有处理器都依赖某种形式的 SRAM 缓存。缓存作为一种高速存储解决方案,由于其紧邻处理核心的战略位置,访问时间非常快。拥有快速且可访问的存储可以显着提高处理性能,并减少核心工作所浪费的时间。 在第 68 届年度 IEEE 国际 EDM 会议上,台积电揭示了 SRAM 缩放方面的巨大问题。该公司正在为 2023 年开发的下一个节点 N3B 将包括与其前身 N5 相同的 SRAM 晶体管密度,后者用于 AMD 的Ryzen 7000 系列等 CPU 。 目前正在为 2024 年开发的另一个节点 N3E 并没有好多少,其 SRAM 晶体管尺寸仅减少了 5%。

3df5e91e-7dfd-11ed-8abf-dac502259ad0.png

根据 WikiChip 的一份报告,讨论了半导体行业中 SRAM 收缩问题的严重性。台积电的 SRAM Scaling 已经大幅放缓。台积电报告说,尽管逻辑晶体管密度继续缩小,但其 SRAM 晶体管的缩放比例已经完全趋于平稳,以至于 SRAM 缓存在多个节点上保持相同的大小。它会迫使处理器 SRAM 缓存在微芯片芯片上占用更多空间。这反过来可能会增加芯片的制造成本,并阻止某些微芯片架构变得尽可能小。 对于未来的 CPU、GPU 和 SoC 来说,这是一个主要问题,由于 SRAM 单元面积缩放缓慢,它们可能会变得更加昂贵。

SRAM 缩放速度变慢

台积电在今年早些时候正式推出其 N3 制造技术时表示,与其 N5(5 纳米级)工艺相比,新节点的逻辑密度将提高 1.6 倍和 1.7 倍。它没有透露的是,与 N5 相比,新技术的 SRAM 单元几乎无法缩放。根据 WikiChip,它从台积电在国际电子设备会议 (IEDM) 上发表的一篇论文中获得信息TSMC 的 N3 具有 0.0199µm² 的 SRAM 位单元尺寸,与 N5 的 0.021µm²SRAM 位单元相比仅小约 5%。改进后的 N3E 变得更糟,因为它配备了 0.021 µm² SRAM 位单元(大致相当于 31.8 Mib/mm²),这意味着与 N5 相比根本没有缩放。 同时,英特尔Intel 4(最初称为 7nm EUV)将 SRAM 位单元大小从 0.0312µm² 减少到 0.024µm²,对于 Intel 7(以前称为 10nm Enhanced SuperFin),我们仍在谈论 27.8 Mib/mm ²,这有点落后于 TSMC 的 HD SRAM 密度。 此外, WikiChip 回忆起 Imec 的演示文稿,该演示文稿显示在带有分支晶体管的“超过 2nm 节点”上的 SRAM 密度约为 60 Mib/mm²。这种工艺技术还需要数年时间,从现在到那时,芯片设计人员将不得不开发具有英特尔和台积电宣传的 SRAM 密度的处理器。

现代芯片中的 SRAM 负载

现代 CPU、GPU 和 SoC 在处理大量数据时将大量 SRAM 用于各种缓存,从内存中获取数据效率极低,尤其是对于各种人工智能 (AI) 和机器学习 (ML) 工作负载。但是现在即使是智能手机的通用处理器、图形芯片和应用处理器也带有巨大的缓存:AMD 的 Ryzen 9 7950X 总共带有 81MB 的缓存,而 Nvidia 的 AD102 使用至少 123MB 的 SRAM 用于 Nvidia 公开披露的各种缓存。 展望未来,对缓存和 SRAM 的需求只会增加,但对于 N3(将仅用于少数产品)和 N3E,将无法减少 SRAM 占用的裸片面积并降低新的更高成本节点与 N5 相比。从本质上讲,这意味着高性能处理器的裸片尺寸将会增加,它们的成本也会增加。同时,就像逻辑单元一样,SRAM 单元也容易出现缺陷。在某种程度上,芯片设计人员将能够通过 N3 的 FinFlex 创新(在一个块中混合和匹配不同种类的 FinFET 以优化其性能、功率或面积)来减轻更大的 SRAM 单元。 台积电计划推出其密度优化的 N3S 工艺技术,与 N5 相比,该技术有望缩小 SRAM 位单元的尺寸,但这将在 2024 年左右发生,我们想知道这是否会为 AMD、Apple 设计的芯片提供足够的逻辑性能,英伟达高通

缓解措施

在成本方面缓解 SRAM 区域扩展放缓的方法之一是采用多小芯片设计,并将较大的缓存分解为在更便宜的节点上制造的单独裸片。这是 AMD 对其 3D V-Cache 所做的事情,尽管原因略有不同。另一种方法是使用替代内存技术,如 eDRAM 或 FeRAM 用于缓存,尽管后者有其自身的特点。 无论如何,在未来几年,基于 FinFET 节点的 3nm 及更高节点的 SRAM 缩放速度放缓似乎是芯片设计人员面临的主要挑战。

编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 台积电
    +关注

    关注

    44

    文章

    5645

    浏览量

    166574
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10871

    浏览量

    211941
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4742

    浏览量

    128976
  • sram
    +关注

    关注

    6

    文章

    768

    浏览量

    114701

原文标题:停止SRAM微缩,意味着更昂贵的CPU和GPU

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    开源芯片系列讲座第24期:基于SRAM存算的高效计算架构

    鹭岛论坛开源芯片系列讲座第24期「基于SRAM存算的高效计算架构」明晚(27日)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目基于SRAM存算的高效计算架构报告简介存算一体是一种
    的头像 发表于 11-27 01:05 257次阅读
    开源<b class='flag-5'>芯片</b>系列讲座第24期:基于<b class='flag-5'>SRAM</b>存算的高效计算架构

    CV3600数字+模拟转数字+模拟带帧率和分辨率缩放的音视频转换芯片

    缩放,HDMI输出的高性能芯片CV3600。 CV3600不仅可以将模拟信号/数字信号转换成HDMI输出,也可以输出模拟VGA/YPBPR,甚至数字RGB/BT1120等 对于输入的分辨率和帧率也可以
    发表于 11-06 13:53

    使用功率缩放

    电子发烧友网站提供《使用功率缩放库.pdf》资料免费下载
    发表于 10-18 10:24 0次下载
    使用功率<b class='flag-5'>缩放</b>库

    DM642 EVM上的视频缩放示例

    电子发烧友网站提供《DM642 EVM上的视频缩放示例.pdf》资料免费下载
    发表于 10-16 10:52 0次下载
    DM642 EVM上的视频<b class='flag-5'>缩放</b>示例

    电机速度变慢跟什么有关联

    本文旨在探讨电机速度变慢的原因,以及如何通过分析和解决这些问题来提高电机的性能。我们将从电机的基本原理、电气系统、机械系统、环境因素等多个方面进行详细分析。 一、引言 电机作为现代工业和日常生活中
    的头像 发表于 06-05 11:21 1558次阅读

    stm8s003/stm8s005单片机控制的电机,当电机转起来时,用手一捏住光感线,电机速度变慢了或是停下,为什么?

    我最近遇到一个问题,很奇怪,也很难解释。我采用的stm8s003 stm8s005单片机控制的电机,用于跑步机方面的。电机的速度反馈采用的是光感,当电机转起来时,我用手一捏住光感线,电机速度变慢
    发表于 05-08 08:13

    STM32L492 DMA多通道复用后速度变慢是什么原因导致的?

    ,现将UART1由中断改为DMA方式,占用了DMA2 6/7通道.结果问题来了, ADC刷新变慢,UART1也经常丢包。个人感觉DMA2在这里是个瓶颈, 在多通道复用上可能有些问题没考虑到。请问哪位在DMA上有类似经验?
    发表于 04-29 07:12

    STM32F103定时器变慢的原因?怎么解决?

    STM32F103 利用定时器设置按键带长按功能和短按键,按键按键是系统关机,短按只是控制led亮灭。但是有时总会出现长按按键变成了控制led,长按时间也足够的长,在观察led的亮灭的频率也变慢,是时钟频率变慢了?最后不能关机只能复位或重新烧录了。
    发表于 04-23 06:52

    Microchip推出容量更大、速度更快的串行SRAM产品线

    /SQI)的速度提高到143MHz。新产品线包括提供2Mb和4Mb两种不同容量的器件,旨在为传统的并行SRAM产品提供成本更低的替代方案,并在SRAM存储器中包含可
    的头像 发表于 04-12 08:23 404次阅读
    Microchip推出容量更大、<b class='flag-5'>速度</b>更快的串行<b class='flag-5'>SRAM</b>产品线

    先进工艺下的SRAM功耗和性能挑战

    随着AI设计对内部存储器访问的要求越来越高,SRAM在工艺节点迁移中进一步增加功耗已成为一个的问题。
    发表于 04-09 10:17 1144次阅读

    STM32上电启动后,会有几率出现程序运行速度变慢的现象,是为什么?

    大家好: 请教个问题,我上电启动后,会有几率出现程序运行速度变慢的现象,比如定时器1s闪烁一次灯,变成了5s闪烁一次。重新上电或软复位后正常。 感觉是启动时,STM32有几率出现时钟没配置正确
    发表于 04-08 07:47

    Microchip推出容量更大、速度更快的串行 SRAM产品线

    Technology(微芯科技公司)扩展了旗下 串行 SRAM 产品线,容量最高可达4 Mb,并将串行外设接口/串行四通道输入/输出接口(SPI/SQI™)的速度提高到143 MHz。新产品线包括提供2 Mb和4
    发表于 04-03 15:24 1195次阅读

    芯片新战场,EDA如何拥抱新挑战

    )工具的需求。面对这些技术进步和市场需求变化,在芯片新战场上,堪称“芯片之母”的EDA又该如何拥抱这些新挑战芯片新战场,挑战重重说起来RI
    的头像 发表于 03-23 08:22 728次阅读
    <b class='flag-5'>芯片</b>新战场,EDA如何拥抱新<b class='flag-5'>挑战</b>?

    SRAM CLA和SRAM有什么区别

    每个SRAM单元的核心由两个CMOS反相器构成,这两个反相器相互连接,每个反相器的输出电位被用作另一个反相器的输入。这种结构使得每个SRAM单元都可以保存一个二进制位(0或1),直到它被新的数据覆盖。
    的头像 发表于 02-19 11:02 998次阅读
    <b class='flag-5'>SRAM</b> CLA和<b class='flag-5'>SRAM</b>有什么区别

    赛普拉斯的NV-SRAM接口解决方案

    赛普拉斯的NV-SRAM将标准快速SRAM单元(访问时间高达20 ns)与基于硅氧化物和亚硝酸盐,氧化物硅(SONOS)的非易失性存储元件相结合,可提供快速的异步读写访问速度,并在其整个工作范围内具有20年的数据保留。
    的头像 发表于 01-09 10:54 596次阅读
    赛普拉斯的NV-<b class='flag-5'>SRAM</b>接口解决方案