0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

全球存算一体技术研究及量产情况最新进展

Carol Li 来源:电子发烧友网 作者:李弯弯 2022-05-05 00:21 次阅读

电子发烧友网报道(文/李弯弯)AI时代,冯诺依曼架构下计算单元与存储单元分离带来的存储墙问题愈发明显,而存算一体被认为是解决存储墙问题的有效方式。

如今国内外众多企业都已经开展存算一体技术的研发,包括英特尔、SK海力士、IBM、美光、三星、台积电、阿里等传统芯片大厂,以及众多新兴AI和存储企业,比如知存科技、后摩智能、苹芯科技、亿铸科技、智芯科、千芯科技、九天睿芯、闪易半导体、恒烁半导体等。

那么目前各家企业的研究和量产情况进展如何呢?各家的技术路线有何差异?存算一体技术未来的整体趋势如何?

传统芯片大厂积极研发,展示最新进展

目前,三星电子、SK海力士、台积电、美光、IBM、英特尔等都在进行存算一体技术的研究,其中有明显进展是三星电子、SK海力士。

三星电子在多个技术路线进行尝试,2021年初,三星发布基于HBM的新型内存,里面集成了AI处理器,该处理器可以实现高达1.2TFLOPS的计算能力,新型HBM-PIM(存内计算)芯片将AI引擎引入每个存储库,从而将处理操作转移到HBM,可以减轻在内存和处理器之间搬运数据的负担。三星表示新型HBM-PIM芯片,可以提供2倍的系统性能,同时能耗降低了70%以上。

今年1月三星电子又带来新研究成果,该公司在顶级学术期刊Nature上发表了全球首个基于MRAM(磁性随机存储器)的存内计算研究。据介绍,三星电子的研究团队通过构建新的MRAM阵列结构,用基于28nm CMOS工艺的MRAM阵列芯片运行了手写数字识别和人脸检测等AI算法,准确率分别为98%和93%。

SK海力士今年2月也公布了基于GDDR接口DRAM存内计算的最新研究成果,并展示了其首款基于存内计算技术产品GDDR6-AiM的样本。

GDDR6-AiM是将计算功能添加到数据传输速度为16Gbps的GDDR6内存产品中,与传统DRAM相比,将GDDR6-AiM与CPUGPU相结合的系统可在特定计算环境中将计算速度提高16倍。此外,由于存内计算在运算中减少了内存与CPU、GPU间的数据传输往来,大大降低了功耗,GDDR6-AiM可使功耗降低80%。

台积电也在进行存内计算的研究,该公司的研究人员在2021年初的国际固态电路会议(ISSCC 2021)上提出了一种基于数字改良的SRAM设计存内计算方案,能支持更大的神经网络

此外美光也曾通过收购人工智能技术初创公司Fwdnxt,尝试开发将内存和计算紧密结合的创新方案,IBM前几年也在相变存储(PCRAM)里实现了神经网络计算功能,英特尔也早早提出了近内存计算战略,将数据在存储层级向上移动,使其更接近处理单元进行计算。

国内新兴企业陆续融资,不少企业进展明显

在存算一体技术推进研发、量产落地方面,国内新兴AI和存储企业进展明显,包括知存科技、后摩智能、苹芯科技、亿铸科技、智芯科、千芯科技、九天睿芯、闪易半导体、恒烁半导体等,其中知存科技、智芯科、九天睿芯、闪易半导体已经有产品量产。


知存科技

知存科技成立于2017年,目前已推出多款存内计算芯片,该公司2021年发布的WTM2101芯片,已经完成批量生产,该芯片采用Flash工艺,处理AI运算时工作功耗最低50uA,峰值算力下功耗低至5mA,神经网络模型参数可达1.8MB,AI峰值算力达50Gops,适合可穿戴设备中的智能语音和智能健康服务。知存科技于2022年1月完成2亿元B1轮融资。

后摩智能

后摩智能成立于2020年底,专注于存算一体技术的大算力AI芯片研发,提供大算力、低功耗的高能效比芯片及解决方案,应用于智能驾驶、泛机器人等边缘端,及云端推理场景。该公司第一代芯片是基于SRAM的智能计算芯片,第二代芯片是基于RRAM等先进存储工艺的芯片,后摩智能于2021年8月宣布完成首款芯片验证流片,于2022年4月完成数亿元人民币Pre-A+轮融资。

苹芯科技

苹芯科技成立于2021年2月,是一家基于存算一体技术打造面向AI加速器芯片的公司。目前已开发多款基于SRAM的存内计算芯片,其首款可商用的存内计算加速单元S200目前正与客户做技术验证,苹芯科技的存内计算产品主要用于可穿戴设备、无人机摄像头、安防领域、机器人领域、智能家居等场景。2021年8月,苹芯科技完成近千万美元Pre-A轮融资。

亿铸科技

亿铸科技成立于2021年9月,主要基于ReRAM路线来实现大算力的存算一体芯片,亿铸科技主要为数据中心自动驾驶等领域打造能效比十倍于现有技术的解决方案,研发能力覆盖从存算一体底层器件,芯片设计到AI软件栈。目前亿铸科技已完成过亿元天使轮融资。

另外在ReRAM架构的全数字存算一体AI计算芯片领域,亿铸科技将会与昕原半导体联手、紧密调试。昕原半导体基于Metal Wire工艺,在ReRAM器件的设计和制造工艺已经实现了全国产化,并已完成业界首款28nm制程ReRAM芯片流片,建成中国大陆首条中试线,拥有垂直一体化存储器设计加制造的能力。

智芯科

智芯科(AistarTek)成立于2019年,主要致力于大算力低功耗的边缘计算芯片设计,产品应用领域包括手机、自动驾驶、安防、无人机、机器人、AR/VR等。该公司此前表示,第一代AT680X针对超低功耗智能语音AIOT市场的量产版产品将在2021年9月份推向市场。2021年7月,智芯科宣布完成近亿元的天使轮融资。

千芯科技

千芯科技(TensorChip)成立于2019年,在国内最早提出可重构存算一体AI芯片架构。公司的核心产品包括高算力低功耗的存算一体AI芯片/IP核,准备量产和投片的可重构存算AI芯片采用的是SRAM。目前已完成由前海融华汇金和新世界投资的数千万元融资。

千芯科技主要推进面向云端推理和边缘计算的AI芯片研发,产品可应用于云计算、自动驾驶、智能安防等领域,在云计算方面,技术团队正在优化产品原型,将AI芯片技术工业客户的需求相结合,目前产品已完成样机验证,处于小批量验证优化阶段。

九天睿芯

九天睿芯成立于2018年6月,该公司基于类脑计算,以模数混和形式,实现感存算一体芯片的研发落地和量产销售,该公司目前已完成亿元级A轮融资。

九天睿芯已经推出包括ADA100和ADA200在内的多款芯片。ADA100是一款超低功耗低算力传感器处理芯片,等效算力1Gops,应用于可穿戴/ARVR/AIoT设备如无线智能相机门铃、门锁、86开关等智能家居产品,于2021年11月量产,2022年批量出货。

ADA200是低功耗中低算力视觉协处理器,算力1-2Tops,应用于低功耗无线摄像头/ARVR/手机平板,将于2022年底量产,ADA200是基于最新感存算一体技术架构实现的模数混合AI视觉芯片,相比传统数字芯片,具备更低功耗,以及超高的能效比。

闪易半导体

闪易半导体成立于2017年,是一家研发高性能、低功耗、低成本的存算一体化AI芯片的公司,首批芯片产品早在2020年就实现批量出货。

公司主要推广语音和图像识别两大解决方案,图像识别产品首先面向需求量极大的消费类电子市场,包括智能手表/手环、AR/VR等可穿戴设备,以及在人脸识别智能门锁中的应用,图像识别产品还在防灾减灾、提升道路安全等多个泛安防场景中实现了批量应用。

恒烁半导体

恒烁半导体成立于2015年,是一家主营业务存储芯片和MCU芯片的集成电路设计企业,自2019年起,开始研发基于NOR Flash架构的存算一体人工智能AI芯片(CINOR)。

对现有NOR Flash阵列进行改造后,2019 年底公司第一款CiNOR V1版在武汉新芯65nm NOR Flash制程上已经完成芯片设计并流片,成功验证了CiNOR芯片原理和可行性,并实现了包括手写识别、ECG检测和人脸检测等几项应用。CiNOR V2芯片正在研发过程中。

阿里达摩院

2021年12月3日,阿里云微信公众号发布消息称,达摩院成功研发存算一体芯片。据介绍,这是全球首款基于DRAM的3D键合堆叠存算一体芯片,它可突破冯·诺依曼架构的性能瓶颈,满足人工智能等场景对高带宽、高容量内存和极致算力的需求。在特定AI场景中,该芯片性能提升10倍以上,效能比提升高达300倍。

新型存储代表着存算一体内技术的未来

目前能做存算一体的存储器包括Flash、SRAM、DRAM、RRAM(忆阻器)、MRAM(磁性存储器)等,不同技术路线各有优劣势,比如Flash具有密度比较高的优点,DRAM成本比较低,MRAM、RRAM等新型存储器除了存储密度较高之外,功耗也比较低等。未来随着人工智能对高性能、低功耗处理需求的不断增强,存算一体技术的开发和应用落地进程将会加速。

其中,在众多存储器中,新型存储器RRAM、MRAM等被格外看好,此前有业内人士对电子发烧友表示,RRAM、MRAM这两类新型存储器代表着存内计算的未来,不过因为技术比较新,目前在工艺成熟度和商业化上还需要一些耐心。

事实上RRAM、MRAM等已经在逐渐取得进展。MRAM是一种基于自旋电子学的新型信息存储器件,其核心结构由一个磁性隧道结和一个访问晶体管构成,和其他存储器相比,MRAM在运行速度、寿命和量产方面存在优势。事实上,早在十几年前就有企业研究和MRAM产品,包括飞思卡尔(被恩智浦并购)、东芝高通等,过去几年台积电、英特尔、三星、SK海力士等晶圆代工厂和IDM也大力投入研发。

此外也有不少初创公司投入研究并取得进展,比如国外的Everspin、Avalanche、Crocus、 Spin Transfer Technology 已经能够提供MRAM样品,国内成立于2019年的亘存科技,已经于2020年完成产业链闭环建设,打通了上下游各关键环节,获得数家来自国内外客户的合作订单和营收,涉及技术涵盖STT-MRAM和 SOT-MRAM等。

RRAM是继电阻电容、电感之后的第四种电路基本元件,这种组件的电阻会随着通过的电流量而改变,它本身就像一个矩阵排列,最适合进行点积乘法和累加运算,而这类运算占深度学习算法中的绝大部分。乘积累加操作可以通过将忆阻器这样的可编程阻变元件直接集成到非易失性高密度存储芯片中来实现,处理单元被嵌入存储器中,可减少数据移动,也就是说忆阻器本身就已具备存内计算的特质,非常适合用于存算一体芯片技术方向。

目前已经有些RRAM进入小批量试产阶段,而且此前清华大学微电子所、未来芯片技术高精尖创新中心钱鹤、吴华强教授团队,与合作者共同研发出一款基于多个忆阻器阵列的存算一体系统,该系统在处理卷积神经网络时的能效,比图形处理器芯片高两个数量级,单芯片算力高达1POPs,大幅提升计算设备的算力,而且功耗比传统芯片降低了100倍。

可以看到,新型存储器RRAM、MRAM等的优势非常明显,不过相比于Flash、SRAM、DRAM等存储器,它们在开发上还有一些问题需要攻克,从当前的进展来看,预计未来几年将会逐渐有产品走向商用。

小结

从统计情况来看,目前已经有基于SRAM、NOR Flash的存算一体产品批量生产,基本上是小算力产品,面向消费、泛安防等低功耗市场;此外可以看到,有不少企业正在研发面向边缘端、云端推理场景的大算力产品,应用于数据中心、智能驾驶等领域,并且已经到了芯片验证阶段,而接下来,除了基于新型存储器的存算一体将会逐渐走向商用,存算一体芯片产品也将从小算力终端消费类应用,逐渐走到面向大算力的智能驾驶、数据中心等应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 技术
    +关注

    关注

    0

    文章

    430

    浏览量

    58441
  • 量产
    +关注

    关注

    0

    文章

    78

    浏览量

    23080
  • 存算一体
    +关注

    关注

    0

    文章

    100

    浏览量

    4287
收藏 人收藏

    评论

    相关推荐

    揭秘超以太网联盟(UEC)1.0 规范最新进展(2024Q4)

    近期,由博通、思科、Arista、微软、Meta等国际顶级半导体、设备和云厂商牵头成立的超以太网联盟(UEC)在OCP Global Summit上对外公布其最新进展——UEC规范1.0的预览版本。让我们睹为快吧!
    的头像 发表于 11-18 16:53 120次阅读
    揭秘超以太网联盟(UEC)1.0 规范<b class='flag-5'>最新进展</b>(2024Q4)

    Qorvo在射频和电源管理领域的最新进展

    了半导体行业的重大变革,还成功引领Qorvo成为射频技术的领导者。在本次专访中,Philip将为大家分享Qorvo在射频和电源管理领域的最新进展,并探讨HPA事业部如何通过技术创新应对全球
    的头像 发表于 11-17 10:57 280次阅读

    一体化与边缘计算:重新定义智能计算的未来

    随着数据量爆炸式增长和智能化应用的普及,计算与存储的高效整合逐渐成为科技行业关注的重点。数据存储和处理需求的快速增长推动了对计算架构的重新设计,“一体化”技术应运而生。同时,随着物
    的头像 发表于 11-12 01:05 124次阅读
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>化与边缘计算:重新定义智能计算的未来

    芯片和封装级互连技术最新进展

    近年来,计算领域发生了巨大变化,通信已成为系统性能的主要瓶颈,而非计算本身。这转变使互连技术 - 即实现计算系统各组件之间数据交换的通道 - 成为计算机架构创新的焦点。本文探讨了通用、专用和量子计算系统中芯片和封装级互连的最新进展
    的头像 发表于 10-28 09:50 315次阅读

    一体架构创新助力国产大力AI芯片腾飞

    在湾芯展SEMiBAY2024《AI芯片与高性能计算(HPC)应用论坛》上,亿铸科技高级副总裁徐芳发表了题为《一体架构创新助力国产大力AI芯片腾飞》的演讲。
    的头像 发表于 10-23 14:48 223次阅读

    高燃回顾|第三届OpenHarmony技术大会精彩瞬间

    第三届OpenHarmony技术大会圆满落幕 全球开源精英齐聚 共同展示OpenHarmony技术、生态、人才的最新进展 见证OpenHarmony南北向生态繁荣 共绘开源生态发展蓝图
    发表于 10-16 18:47

    后摩智能推出边端大模型AI芯片M30,展现出一体架构优势

    了基于M30芯片的智模组(SoM)和力谋®️AI加速卡。   后摩智能一体架构芯片产品   后摩智能是家专注于
    的头像 发表于 07-03 00:58 4087次阅读

    科技助力AI应用落地:WTMDK2101-ZT1评估板实地评测与性能揭秘

    一体领域的研发领导者 一体技术作为解决冯诺依曼架构下存储墙问题的重要方案,吸引了国内外众多企业的研发投入,其中知
    发表于 05-16 16:38

    探索内计算—基于 SRAM 的内计算与基于 MRAM 的一体的探究

    本文深入探讨了基于SRAM和MRAM的一体技术在计算领域的应用和发展。首先,介绍了基于SRAM的内逻辑计算
    的头像 发表于 05-16 16:10 2487次阅读
    探索<b class='flag-5'>存</b>内计算—基于 SRAM 的<b class='flag-5'>存</b>内计算与基于 MRAM 的<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>的探究

    科技携手北大共建一体技术实验室,推动AI创新

    揭牌仪式结束后,王绍迪在北大集成电路学院举办的“未名·芯”论坛上做了主题演讲,分享了他对于多模态大模型时代内计算发展的见解。他强调了一体在人工智能领域的重要性及其未来发展趋势。
    的头像 发表于 05-08 17:25 876次阅读

    百度首席技术官王海峰解读文心大模型的关键技术最新进展

    4月16日,以“创造未来”为主题的Create 2024百度AI开发者大会在深圳国际会展中心成功举办。百度首席技术官王海峰以“技术筑基,星河璀璨”为题,发表演讲,解读了智能、代码、多模型等多项文心大模型的关键
    的头像 发表于 04-18 09:20 663次阅读
    百度首席<b class='flag-5'>技术</b>官王海峰解读文心大模型的关键<b class='flag-5'>技术</b>和<b class='flag-5'>最新进展</b>

    两家企业有关LED项目的最新进展

    近日,乾富半导体与英创力两家企业有关LED项目传来最新进展
    的头像 发表于 01-15 13:37 652次阅读

    一体芯片如何支持Transformer等不同模型?

    后摩智能致力于打造通用人工智能芯片,自主研发的一体芯片在支持各类模型方面表现突出,包括YOLO系列网络、BEV系列网络、点云系列网络等。
    的头像 发表于 01-05 14:14 1291次阅读

    SRAM一体芯片的研究现状和发展趋势

    人工智能时代对计算芯片的力和能效都提出了极高要求。一体芯片技术被认为是有望解决处理器芯片“存储墙”瓶颈,大幅提升人工智能
    的头像 发表于 01-02 11:02 2294次阅读
    SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>芯片的<b class='flag-5'>研究</b>现状和发展趋势

    浅谈为AI大力而生的-芯片

    大模型爆火之后,一体获得了更多的关注与机会,其原因之是因为
    发表于 12-06 15:00 365次阅读
    浅谈为AI大<b class='flag-5'>算</b>力而生的<b class='flag-5'>存</b><b class='flag-5'>算</b>-<b class='flag-5'>体</b>芯片