存储器的历史始于1984年,彼时 Masuoka 教授发明了 NAND Flash(NAND 闪存)。1989年,东芝首款 NAND Flash 上市。2001年,许多Flash厂商推出MLC NAND Flash。2007年,东芝推出3D NAND,三星也在2012年发布其第一代3D NAND。NAND Flash 技术几十年发展保留了相同的概念、堆叠(stack)和架构,存储密度随时间呈指数增长。
2010年以后,嵌入式存储器(embedded memories, 指“集成在片内与系统中各个逻辑、混合信号等IP 共同组成单一芯片中的存储器”)开始达到28nm节点,但是,存储器单元(cell)在面积收缩能力、复杂度进展缓慢,技术迭代的压力被转移到新兴内存和更先进的工艺节点上。
2015 年,英特尔和美光公司开发了基于相变存储器(PCM)的3D XPoint技术,填补 DRAM 和 Flash 之间的延迟差距,使新内存架构成为可能,也为非易失性内存(NVM)领域带来了创新。自2017年起,这项技术以 Optane品牌在公开市场上市。峰回路转,2021年美光不再认为3D Xpoint 的持续投资是合理的,宣布放弃3D Xpoint;2022年业界传出消息,英特尔正在关闭 Optane 业务部门。
3D XPoint 未成气候,或许表明“方向比努力更重要”,新技术要有市场,关键在于能否解决应用的计算和内存瓶颈。例如,模拟人脑的计算系统往往要求高能量效率、并行性以及诸如对象识别、联想、适应和学习的认知能力,对计算和内存之间的协同工作提出新要求。
此外,社交网络、流媒体和视频点播等的消费电子应用,以及智能家居、智慧城市等物联网应用盛行,连接网络的智能设备大量增加,数据量和数据中心增长快速,计算系统的能量消耗更多地受到数据传输的影响,而不是计算本身。
面对上述问题,业界需要计算系统结构的新规范,导致了以内存为中心和“存内计算 In-memory computing”系统的兴起。在进一步探讨这些技术之前,不得不提一下近期存储器的行情走向。
需求低迷、上游原厂减产
库存调整或贯穿 2023 年
存储器市场存在较强的周期性,交替出现短缺或者供应过剩的时期,导致价格变化、收入波动等情况,当前存储器市场有几个情况。
首先是降价。综合媒体和研究机构的消息,存储器的供需处于失衡状态。TrendForce 集邦咨询报告显示,NAND Flash 正处于供过于求的状态,下半年起,买方着重去化库存,大幅减少采购量,卖方开出破盘价以巩固订单,使第三季晶圆(Wafer)价格跌幅达30~35%。但各类 NAND Flash 终端产品仍疲弱,原厂库存因此急速上升,导致第四季 NAND Flash 价格跌幅扩大至15~20%。而绝大部分原厂的 NAND Flash 产品销售也将自今年底前正式步入亏损。原因是在高通胀影响下,消费电子产品需求疲软,第三季存储器出货量呈现每个季度递减的趋势,终端买方因存储器需求明显下滑而延缓采购,导致供应商库存压力进一步升高。
类似的,各 DRAM 供应商为求增加市占的策略不变,市场上已有“第三、四季合并议价”或“先谈量再议价”的情形,皆是导致第四季 DRAM 价格跌幅扩大至13~18% 的原因。
其次是减产。部分供应商在运营陷入亏损的压力下,减产以降低亏损是可能的对应方式。芯查查 APP 显示,美光已经于9月底宣布削减 DRAM 和NAND Flash 的产量,成为头家式降低产能利用率的制造商,并强调其在2023 年大幅下调资本支出,DRAM 生产比特的年增长率仅为 5% 左右。
NAND Flash 市场形势比 DRAM更为严峻,主流产能晶圆的平均合同价格已经下降到现金成本,并且正在接近各个制造商亏损销售的边缘。Kioxia(铠侠)在美光之后相继宣布,将从10月份起将 NAND Flash 产能利用率降低 30%。DRAM 目前的合同价格仍然高于主流供应商的总生产成本,因此与NAND Flash 相比,是否会有进一步的减产还有待观察。
减产对于芯片原厂的产品升级计划造成影响。美光原计划从四季度开始逐步提高232层 NAND Flash 的比例,减产之后,主流工艺估计2023年仍以176层产品为主。Kioxia 和 WDC 原计划从四季度开始迁移到162层产品,但是 WDC 减少2023年资本支出,加上需求能见度低,无法实现原定计划。
趋势 1
突破传统架构,RRAM(ReRAM)存算一体
有望提升计算系统能效比
文章开头提及,开发新计算系统源于几点:数据指数增长、功耗增加,当前计算系统的性能限制也是原因之一。对此,业界提出“近内存”或存内计算(In-memory Computing),以解决数据中心的几个问题,包括数据传输“存储墙”(Memory barrier)、高功耗和时间成本。涉及深度学习网络的数据中心需要巨大的计算能量,要求高可靠性、更出色容量、带宽和性能的存储器,从而衍生出关于新的非冯·诺依曼系统的新兴存储技术研究。
普遍认为,RRAM(也即 ReRAM,阻变式随机存取存储器)、PCM(相变随机存取存储器)和 MRAM(磁随机存取存储器)等是下一代存储技术路线,这些也是“存内计算”的基础技术,从技术特征来看,这些技术有哪些独特性?
资深电子器件专家 Ray 表示,上述的下一代非易失性存储器首先是作为存储级内存被提出的,在存储层级中介于内存和硬盘之间,因此,存储的性能指标对这些下一代非易失性存储器仍然适用,如面积、功耗、读写速度、集成性、成本等。此外,下一代非易失性存储器也非常适用于存内计算,而存内计算又对这些存储器提出了新的要求,如开关比、多阻态、鲁棒性等。RRAM、PCM 和 MRAM 等是目前研究较多的下一代非易失性存储器,它们各有优势和不足。
MRAM 中的磁性材料磁化方向变化的时候,从磁性材料两端电极上读取得到的隧穿电流会发生变化,从而得到不同电阻,其编写速度快、重复编写周期长,但其材料制备较复杂、开关比较低、易受扰动。
PCM 是利用相变材料在焦耳热作用下,在结晶态和非晶态之间转换,从而呈现出不同阻态,其已经在英特尔等公司的产品中使用,大规模集成性较好,但其写入速度较慢、写入能耗较大。
RRAM 主要依靠绝缘层在电场作用下,通过离子的迁移形成导电细丝,再通过控制导电细丝的通断控制阻态,综合来看在各个指标上均具有比较优异的性质,其结构简单、存储密度高且支持片上3D 集成、开关比可达1000以上、读写速度和功耗适中,且其可通过控制导电细丝的形态形成多阻态,从而模仿生物大脑中神经突触功能,适合存内计算和类脑计算。
目前 RRAM 作为新兴存储器,其规模化制备的良率、成本、外围控制电路等还需进一步优化,同时,我们也很欣喜地看到国内和国际的多家制造厂商已经布局 RRAM 的制备,并且已完成晶圆级 RRAM 芯片的流片。
在 RRAM 商业化之前,还需要解决哪些难题?Ray 说道,同其他研究一样,RRAM 的科研主要解决科学问题,在进行商业化的时候还有很多工程问题需要解决,包括大规模制造、架构和软件的配合、应用场景等,但目前来看,其很多科学问题已经经过了大量的研究,取得了很多突破,这些技术问题相信随着时间的推移也将逐步解决。
物联网和网络边缘的人工智能(AI)和机器学习(ML)快速增长,这些应用端的计算系统的能效比的问题日益突出,而 RRAM 作为一种较佳的解决方案,成为研究的焦点。
Ray 进一步说道,目前的计算架构采用冯诺伊曼架构,其存储与计算单元分离,因此,在 AI 等计算应用中,大量数据需要不断在片下的内存和片上的计算单元之间搬运,然而由于内存带宽不足带来的“存储墙”问题,导致计算延时和能耗较高,难以满足 AI 模型的算力和功耗需求。存算一体技术将存储单元与计算单元融合,在存储器内利用物理定律进行计算,避免了“存储墙”问题,极大地降低了数据搬运的能耗和延时,并提升了计算的能效比。基于 RRAM 的存算一体目前是国内外的研究热点和前沿,其主要实现方式分为两种,即模拟式存算一体和数字式存算一体。
模拟式存算一体利用了 RRAM 的模拟式阻态特性,通过电导存储多比特数据。以神经网络中应用较广泛的矩阵乘积运算为例,其电导值存储神经网络的权值,输入为电压值,利用欧姆定律完成乘法,得到电流值,然后阵列中同一条数据线上的电流根据基尔霍夫电流定律相加,从而完成乘加运算。模拟式存算一体可以达到较高的存储密度,但其对环境噪声和温度较敏感,运算精度较低,主要适合低精度、小算力的应用场景。
而数字式存算一体中,其每个 RRAM 只存储一比特数据,经过乘法运算得到电流后再经过数字电路进行后续加法等运算,此种方法虽然存储密度低于模拟式存算一体,但其优势是在保证计算能效比的前提下,支持高精度、大算力的运算,提高计算的鲁棒性,从而极大地拓展了存算一体的应用场景。
相比于 CMOS 器件,目前 RRAM 的局限性主要体现在编写周期有限上,因此目前 RRAM 主要适用于 AI 推理等操作,而相信随着工艺的演进,得到更高编写周期的 RRAM 也是非常有希望的。另一个局限性是 RRAM 阻值的波动性,而此问题在数字式存算一体中可以得到很好的解决。
-
PCM
+关注
关注
1文章
195浏览量
53203 -
存储器
+关注
关注
38文章
7484浏览量
163763 -
MRAM
+关注
关注
1文章
236浏览量
31717 -
RRAM
+关注
关注
0文章
28浏览量
21346 -
亿铸科技
+关注
关注
0文章
24浏览量
1377
原文标题:亿分享 | 供需混沌,迭代如常,存储器迎来怎样的 2023?
文章出处:【微信号:亿铸科技,微信公众号:亿铸科技】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论