0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

忆阻器(RRAM)存算一体路线再次被肯定

亿铸科技 来源:偲睿洞察 2023-10-26 09:13 次阅读

近日,清华大学发布的一颗忆阻器存算一体芯片,火了。该芯片的火爆源于一个月前,清华大学发的一篇论文:

2023年9月14日,清华大学吴华强及高滨共同通讯在Science在线发表题为“Edge learning using a fully integrated neuro-inspired memristor chip”的研究论文,论文显示,团队基于存算一体计算范式,研制出全系统集成、支持高效片上学习(机器学习能在硬件端直接完成)的忆阻器存算一体芯片。

“忆阻器存算一体”这一概念瞬间引爆学界与产业界,甚至登上了微博高位热搜。据笔者获悉,清华大学所用的忆阻器件就是RRAM(ReRAM)。

此次清华大学科研成果的意义,不仅在于研发出首颗基于忆阻器(RRAM)的片上学习存算一体芯片,更在于为产业界存算一体存储介质的应用和发展给出了更多方向,以及在技术实践上的引导性意见。

本文试图探究,学界与产界为何要选择研发该路线?该路线的发展前景如何?

PART-01

忆阻器存算一体是为何物?

无论是从其官方表述,还是论文中“可重构的忆阻器存算一体架构图”,我们都能明确知道,清华大学所说忆阻器便是阻变存储器RRAM(ReRAM)。

2022年9月,清华大学集成电路学院钱鹤、吴华强教授课题组联合斯坦福大学、加州大学圣地亚哥分校(UCSD)、圣母大学等在《自然》(Nature)发表的题为A compute-in-memory chip based on resistive random-access memory研究论文。

该论文报道了一款基于忆阻器(阻变存储器)的存算一体芯片NeuRRAM。该芯片具有可重新配置的计算核心(reconfiguring CIM cores),可以兼容不同的模型结构。

0dfdf6dc-7327-11ee-939d-92fbcf53809c.png

(可重构的忆阻器存算一体架构图源:清华大学) 专家表示,从定义来看,忆阻器(英文:memristor)为电阻受先前通过电荷量控制的电子器件,其特点为通常具有电流电压蝴蝶形回滞曲线。忆阻器的概念最早由蔡少棠教授提出,最早由阻变存储器,即RRAM实验验证,因此经常以RRAM作为忆阻器的代表。

当然,严格来说,根据材料和物理机制,忆阻器件可分为阻变存储器(Resistive Random-Access Memory, 简称RRAM或ReRAM),相变存储器(PCRAM),磁随机存储器(MRAM)和铁电随机存储器(FeRAM)等不同种类。此外还有光电忆阻器、有机材料忆阻器、流体忆阻器等。

也就是说,忆阻器有着诸多选项,那么为何要选择阻变存储器RRAM?

我们都知道的是,传统冯·诺依曼结构下,数据的存储和计算相互分离,即数据存储在储存器中,需要计算时再把它搬运到运算器里。然而,AI类应用(例如大模型)需要对大量数据进行矩阵运算,其核心是乘法和加法,在此情形下算力是比较吃紧的,面临着很大挑战。

如何拉近“存”“算”距离,即打破存储墙,成为AI计算的当务之急,清华大学给的解决方案便是基于忆阻器(RRAM)的存算一体。

具体来说,如果用交叉阵列的方式做忆阻器,就可获得一种与矩阵很类似的结构,这种结构既可以存数据,也可以做计算。需要存储时,忆阻器本身就是存储器;而需要运算时,也无需把数据从存储器中搬到运算器里,因为忆阻器可直接用欧姆定律来做乘法运算。

如此,数据便能“原地”计算,大大降低了由于数据“跑来跑去”所带来的消耗。

除此之外,忆阻器(RRAM)还有着其他优点:比如尺寸小、速度快、与 CMOS(互补式金氧半导体)工艺可兼容等。

0e09fc0c-7327-11ee-939d-92fbcf53809c.png  

于是,又能算又能存的忆阻器(RRAM)成了缓解算力焦虑的良药,引得包括清华大学在内的多方精英竞相布局。

PART-02

忆阻器(RRAM),学界与产界公认的存算一体最佳器件

尽管有着诸多好处,忆阻器(RRAM)作为存储器的发展却十分坎坷。

2000年便有企业着手研发——夏普购买了美国休斯敦大学忆阻器(RRAM)的相关专利进行相关布局,但到了去年才真正在业内迎来应用的爆发。

那么,为何忆阻器(RRAM)在去年才迎来爆发时刻?

这是因为,根据以往经验,找到合适的赛道,往往是存储器大放光彩的转折点。现如今,忆阻器(RRAM)作为存算一体AI计算的存储介质,在AI大算力场景发光发热。 例如NOR Flash,便是凭借更快的读取速度、可随机访问等特点,在功能机时代夺得一席之地;所以,当功能机时代过去后,NOR Flash一度低迷。

而当外挂一个高可靠性、快速读取的存储器又成为解决AMOLED面板的蓝色光会随时间消退的问题的最优解,NOR Flash,又随着AMOLED的需求迎来自己的第二春。 而在存算一体芯片的存储器件选择中,基于忆阻器(RRAM)设计的存算一体芯片具有非易失性、读写速度快、稳定性强、功耗低、 CMOS工艺兼容、微缩化发展天花板高等优势,相比于SRAM、Flash,忆阻器(RRAM)更适用于存算一体AI大算力赛道。

0e1416d8-7327-11ee-939d-92fbcf53809c.png

不过,据EETOP表示,忆阻器依然面临着严峻的挑战,其中一个关键挑战就是模拟计算的误差累积。

在机器之心有关清华大学可重构数字存算一体架构主题的文章中提到,模拟计算由于工艺偏差、信号噪声等因素容易产生计算误差,通常最高只能支持INT8数据格式,难以支持更高位宽计算。

这就导致当前的模拟存算一体AI芯片通常只能同时激活很小部分存储器阵列。这限制了它们单位面积下的计算能力,使得兼顾能效和精度变得更加困难。

而数字存算一体并不受信噪比影响,精度可以达32bit甚至更高,且可支持浮点计算。同时,数字存算一体对于不同制造工艺、电源电压和温度的变化呈现很强的鲁棒性。

故,相比于模拟存算,数字存算的方式可以实现更高的运算精度以及更好的可靠性。

据笔者对国内存算一体项目的了解,现阶段仅有亿铸科技基于忆阻器(RRAM)实现了数字存算一体POC芯片的回片及成功验证。据悉,公司名中“亿铸”二字便来源于忆阻器中“忆阻”二字的谐音。

而亿铸科技这颗存算一体POC芯片是首颗基于忆阻器(RRAM)的面向数据中心云计算自动驾驶等大算力场景的存算一体芯片。该芯片的能效比表现,远超预期——能够达到同等工艺下传统架构AI算力芯片的20倍以上。

现如今,随着工艺的不断成熟,学界关于忆阻器(RRAM)存算一体的研究正愈发积极:在2022年度ISSCC会议上,台积电发表六篇关于存内计算存储器IP的论文,大力推进基于忆阻器(RRAM)的存内计算方案。

而在产业界中,亿铸科技从公司创立之初就坚定地选择忆阻器(RRAM)存算一体路线。

尽管过去业内对忆阻器(RRAM)有着“不够成熟、主要面向小算力应用场景”等误解,不过自2023年始,多家存算一体AI芯片初创公司也纷纷公开表示,未来将布局基于忆阻器(RRAM)的存算一体产品

例如,在2023光锥智能线上对谈之中,以研发SRAM存算芯片为主的苹芯科技创始人杨越表示,以RRAM为代表的新型存储器在低功耗和存储密度方面存在天然的优势,在过去五年里工艺和良率有大幅度提升。

在2023 AI芯片峰会上,同样是以研发SRAM存算芯片为主的千芯科技董事长陈巍直言忆阻器(RRAM)存算一体的好处:以RRAM为代表的存算一体方案的存储架构缩短为两层,几乎是大模型运算的极限,因此更有助于进行大模型的运算。

现如今,基于冯诺依曼传统架构的摩尔定律走向物理极限,“算力焦虑”无法再通过提升先进制程缓解。以忆阻器(RRAM)存算一体等为代表的一系列新技术,才是真正的“对症下药”。

越来越多的AI芯片厂商们,正通过硬件层面的革新,把AI技术,带进数据中心、自动驾驶等大算力场景之中。

忆阻器(RRAM)存算一体,终于迎来自己的“美丽人生”。








审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • CMOS
    +关注

    关注

    58

    文章

    5713

    浏览量

    235466
  • 运算器
    +关注

    关注

    1

    文章

    163

    浏览量

    16567
  • 忆阻器
    +关注

    关注

    8

    文章

    73

    浏览量

    19866
  • RRAM
    +关注

    关注

    0

    文章

    28

    浏览量

    21346
  • 阻变存储器
    +关注

    关注

    0

    文章

    8

    浏览量

    7922

原文标题:算力焦虑有救了:忆阻器(RRAM)存算一体路线再次被肯定

文章出处:【微信号:亿铸科技,微信公众号:亿铸科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    自旋:最像大脑的存储

      种名为“自旋”的新型神经形态元件模仿人类大脑的节能运作,将AI应用程序的功耗降低到传统设备的1/100。TDK与法国研究机构CEA合作开发了这种“自旋
    的头像 发表于 12-07 10:08 151次阅读

    直播预约 |开源芯片系列讲座第24期:SRAM一体:赋能高能效RISC-V计算

    鹭岛论坛开源芯片系列讲座第24期「SRAM一体:赋能高能效RISC-V计算」11月27日(周三)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目SRAM
    的头像 发表于 11-16 01:10 194次阅读
    直播预约 |开源芯片系列讲座第24期:SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>:赋能高能效RISC-V计算

    一体化与边缘计算:重新定义智能计算的未来

    随着数据量爆炸式增长和智能化应用的普及,计算与存储的高效整合逐渐成为科技行业关注的重点。数据存储和处理需求的快速增长推动了对计算架构的重新设计,“一体化”技术应运而生。同时,随着物联网、5G网络
    的头像 发表于 11-12 01:05 217次阅读
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>化与边缘计算:重新定义智能计算的未来

    一体架构创新助力国产大力AI芯片腾飞

    在湾芯展SEMiBAY2024《AI芯片与高性能计算(HPC)应用论坛》上,亿铸科技高级副总裁徐芳发表了题为《一体架构创新助力国产大力AI芯片腾飞》的演讲。
    的头像 发表于 10-23 14:48 292次阅读

    后摩智能推出边端大模型AI芯片M30,展现出一体架构优势

    电子发烧友网报道(文/李弯弯)近日,后摩智能推出基于一体架构的边端大模型AI芯片——后摩漫界™️M30,最高力100TOPS,典型功耗12W。为了进
    的头像 发表于 07-03 00:58 4190次阅读

    科技助力AI应用落地:WTMDK2101-ZT1评估板实地评测与性能揭秘

    适用于一体的存储类型包括 PCAM、MRAM、RRAM 和 FRAM 等。其中,
    发表于 05-16 16:38

    探索内计算—基于 SRAM 的内计算与基于 MRAM 的一体的探究

    本文深入探讨了基于SRAM和MRAM的一体技术在计算领域的应用和发展。首先,介绍了基于SRAM的内逻辑计算技术,包括其原理、优势以及在神经网络领域的应用。其次,详细讨论了基于MR
    的头像 发表于 05-16 16:10 2799次阅读
    探索<b class='flag-5'>存</b>内计算—基于 SRAM 的<b class='flag-5'>存</b>内计算与基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>的探究

    科技携手北大共建一体化技术实验室,推动AI创新

    揭牌仪式结束后,王绍迪在北大集成电路学院举办的“未名·芯”论坛上做了主题演讲,分享了他对于多模态大模型时代内计算发展的见解。他强调了一体在人工智能领域的重要性及其未来发展趋势。
    的头像 发表于 05-08 17:25 947次阅读

    北京大学-知科技一体联合实验室揭牌,开启知科技产学研融合战略新升级

    5月5日,“北京大学-知科技一体技术联合实验室”在北京大学微纳电子大厦正式揭牌,北京大学集成电路学院院长蔡茂、北京大学集成电路学院副
    的头像 发表于 05-07 19:31 1424次阅读
    北京大学-知<b class='flag-5'>存</b>科技<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>联合实验室揭牌,开启知<b class='flag-5'>存</b>科技产学研融合战略新升级

    通向计算新未来,自旋步降低能耗

    的全称是记忆电阻,是种表示磁通和电荷关系的电路元件。通过测定的阻值,可知道流经它的电荷量,从而有记忆电荷的作用。
    的头像 发表于 04-30 00:53 3808次阅读

    聚焦全国一体力体系构建,联以强大力“引擎”释放力潜能

    力是数字时代的生产力,为数字经济与实体经济深度融合提供了强大支持。在不久前结束的全国两会中,“全国一体力体系”成为新词热词,会议提出“适度超前建设数字基础设施,加快形成全国一体
    的头像 发表于 03-22 18:13 529次阅读
    聚焦全国<b class='flag-5'>一体</b>化<b class='flag-5'>算</b>力体系构建,<b class='flag-5'>忆</b>联以强大<b class='flag-5'>存</b>力“引擎”释放<b class='flag-5'>算</b>力潜能

    什么是通感一体化?通感一体化的应用场景

    通感一体化可广泛应用于智能家居、智慧城市、智慧交通、医疗健康等方面。文档君为大家搜集了些典型的应用场景。 智能家居 通感一体化利用基站
    发表于 01-18 16:12 1.1w次阅读
    什么是通感<b class='flag-5'>算</b><b class='flag-5'>一体</b>化?通感<b class='flag-5'>算</b><b class='flag-5'>一体</b>化的应用场景

    一体芯片如何支持Transformer等不同模型?

    后摩智能致力于打造通用人工智能芯片,自主研发的一体芯片在支持各类模型方面表现突出,包括YOLO系列网络、BEV系列网络、点云系列网络等。
    的头像 发表于 01-05 14:14 1350次阅读

    SRAM一体芯片的研究现状和发展趋势

    人工智能时代对计算芯片的力和能效都提出了极高要求。一体芯片技术认为是有望解决处理芯片“
    的头像 发表于 01-02 11:02 2471次阅读
    SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>芯片的研究现状和发展趋势