电子发烧友网报道(文/李弯弯)AI时代,冯诺依曼架构下计算单元与存储单元分离带来的存储墙问题愈发明显,而存算一体被认为是解决存储墙问题的有效方式。
如今国内外众多企业都已经开展存算一体技术的研发,包括英特尔、SK海力士、IBM、美光、三星、台积电、阿里等传统芯片大厂,以及众多新兴AI和存储企业,比如知存科技、后摩智能、苹芯科技、亿铸科技、智芯科、千芯科技、九天睿芯、闪易半导体、恒烁半导体等。
那么目前各家企业的研究和量产情况进展如何呢?各家的技术路线有何差异?存算一体技术未来的整体趋势如何?
传统芯片大厂积极研发,展示最新进展
目前,三星电子、SK海力士、台积电、美光、IBM、英特尔等都在进行存算一体技术的研究,其中有明显进展是三星电子、SK海力士。
三星电子在多个技术路线进行尝试,2021年初,三星发布基于HBM的新型内存,里面集成了AI处理器,该处理器可以实现高达1.2TFLOPS的计算能力,新型HBM-PIM(存内计算)芯片将AI引擎引入每个存储库,从而将处理操作转移到HBM,可以减轻在内存和处理器之间搬运数据的负担。三星表示新型HBM-PIM芯片,可以提供2倍的系统性能,同时能耗降低了70%以上。
今年1月三星电子又带来新研究成果,该公司在顶级学术期刊Nature上发表了全球首个基于MRAM(磁性随机存储器)的存内计算研究。据介绍,三星电子的研究团队通过构建新的MRAM阵列结构,用基于28nm CMOS工艺的MRAM阵列芯片运行了手写数字识别和人脸检测等AI算法,准确率分别为98%和93%。
SK海力士今年2月也公布了基于GDDR接口的DRAM存内计算的最新研究成果,并展示了其首款基于存内计算技术产品GDDR6-AiM的样本。
GDDR6-AiM是将计算功能添加到数据传输速度为16Gbps的GDDR6内存产品中,与传统DRAM相比,将GDDR6-AiM与CPU、GPU相结合的系统可在特定计算环境中将计算速度提高16倍。此外,由于存内计算在运算中减少了内存与CPU、GPU间的数据传输往来,大大降低了功耗,GDDR6-AiM可使功耗降低80%。
台积电也在进行存内计算的研究,该公司的研究人员在2021年初的国际固态电路会议(ISSCC 2021)上提出了一种基于数字改良的SRAM设计存内计算方案,能支持更大的神经网络。
此外美光也曾通过收购人工智能技术初创公司Fwdnxt,尝试开发将内存和计算紧密结合的创新方案,IBM前几年也在相变存储(PCRAM)里实现了神经网络计算功能,英特尔也早早提出了近内存计算战略,将数据在存储层级向上移动,使其更接近处理单元进行计算。
国内新兴企业陆续融资,不少企业进展明显
在存算一体技术推进研发、量产落地方面,国内新兴AI和存储企业进展明显,包括知存科技、后摩智能、苹芯科技、亿铸科技、智芯科、千芯科技、九天睿芯、闪易半导体、恒烁半导体等,其中知存科技、智芯科、九天睿芯、闪易半导体已经有产品量产。
知存科技
知存科技成立于2017年,目前已推出多款存内计算芯片,该公司2021年发布的WTM2101芯片,已经完成批量生产,该芯片采用Flash工艺,处理AI运算时工作功耗最低50uA,峰值算力下功耗低至5mA,神经网络模型参数可达1.8MB,AI峰值算力达50Gops,适合可穿戴设备中的智能语音和智能健康服务。知存科技于2022年1月完成2亿元B1轮融资。
后摩智能
后摩智能成立于2020年底,专注于存算一体技术的大算力AI芯片研发,提供大算力、低功耗的高能效比芯片及解决方案,应用于智能驾驶、泛机器人等边缘端,及云端推理场景。该公司第一代芯片是基于SRAM的智能计算芯片,第二代芯片是基于RRAM等先进存储工艺的芯片,后摩智能于2021年8月宣布完成首款芯片验证流片,于2022年4月完成数亿元人民币Pre-A+轮融资。
苹芯科技
苹芯科技成立于2021年2月,是一家基于存算一体技术打造面向AI加速器芯片的公司。目前已开发多款基于SRAM的存内计算芯片,其首款可商用的存内计算加速单元S200目前正与客户做技术验证,苹芯科技的存内计算产品主要用于可穿戴设备、无人机摄像头、安防领域、机器人领域、智能家居等场景。2021年8月,苹芯科技完成近千万美元Pre-A轮融资。
亿铸科技
亿铸科技成立于2021年9月,主要基于ReRAM路线来实现大算力的存算一体芯片,亿铸科技主要为数据中心和自动驾驶等领域打造能效比十倍于现有技术的解决方案,研发能力覆盖从存算一体底层器件,芯片设计到AI软件栈。目前亿铸科技已完成过亿元天使轮融资。
另外在ReRAM架构的全数字存算一体AI计算芯片领域,亿铸科技将会与昕原半导体联手、紧密调试。昕原半导体基于Metal Wire工艺,在ReRAM器件的设计和制造工艺已经实现了全国产化,并已完成业界首款28nm制程ReRAM芯片流片,建成中国大陆首条中试线,拥有垂直一体化存储器设计加制造的能力。
智芯科
智芯科(AistarTek)成立于2019年,主要致力于大算力低功耗的边缘计算芯片设计,产品应用领域包括手机、自动驾驶、安防、无人机、机器人、AR/VR等。该公司此前表示,第一代AT680X针对超低功耗智能语音AIOT市场的量产版产品将在2021年9月份推向市场。2021年7月,智芯科宣布完成近亿元的天使轮融资。
千芯科技
千芯科技(TensorChip)成立于2019年,在国内最早提出可重构存算一体AI芯片架构。公司的核心产品包括高算力低功耗的存算一体AI芯片/IP核,准备量产和投片的可重构存算AI芯片采用的是SRAM。目前已完成由前海融华汇金和新世界投资的数千万元融资。
千芯科技主要推进面向云端推理和边缘计算的AI芯片研发,产品可应用于云计算、自动驾驶、智能安防等领域,在云计算方面,技术团队正在优化产品原型,将AI芯片技术与工业客户的需求相结合,目前产品已完成样机验证,处于小批量验证优化阶段。
九天睿芯
九天睿芯成立于2018年6月,该公司基于类脑计算,以模数混和形式,实现感存算一体芯片的研发落地和量产销售,该公司目前已完成亿元级A轮融资。
九天睿芯已经推出包括ADA100和ADA200在内的多款芯片。ADA100是一款超低功耗低算力传感器处理芯片,等效算力1Gops,应用于可穿戴/ARVR/AIoT设备如无线智能相机门铃、门锁、86开关等智能家居产品,于2021年11月量产,2022年批量出货。
ADA200是低功耗中低算力视觉协处理器,算力1-2Tops,应用于低功耗无线摄像头/ARVR/手机平板,将于2022年底量产,ADA200是基于最新感存算一体技术架构实现的模数混合AI视觉芯片,相比传统数字芯片,具备更低功耗,以及超高的能效比。
闪易半导体
闪易半导体成立于2017年,是一家研发高性能、低功耗、低成本的存算一体化AI芯片的公司,首批芯片产品早在2020年就实现批量出货。
公司主要推广语音和图像识别两大解决方案,图像识别产品首先面向需求量极大的消费类电子市场,包括智能手表/手环、AR/VR等可穿戴设备,以及在人脸识别智能门锁中的应用,图像识别产品还在防灾减灾、提升道路安全等多个泛安防场景中实现了批量应用。
恒烁半导体
恒烁半导体成立于2015年,是一家主营业务存储芯片和MCU芯片的集成电路设计企业,自2019年起,开始研发基于NOR Flash架构的存算一体人工智能AI芯片(CINOR)。
对现有NOR Flash阵列进行改造后,2019 年底公司第一款CiNOR V1版在武汉新芯65nm NOR Flash制程上已经完成芯片设计并流片,成功验证了CiNOR芯片原理和可行性,并实现了包括手写识别、ECG检测和人脸检测等几项应用。CiNOR V2芯片正在研发过程中。
阿里达摩院
2021年12月3日,阿里云微信公众号发布消息称,达摩院成功研发存算一体芯片。据介绍,这是全球首款基于DRAM的3D键合堆叠存算一体芯片,它可突破冯·诺依曼架构的性能瓶颈,满足人工智能等场景对高带宽、高容量内存和极致算力的需求。在特定AI场景中,该芯片性能提升10倍以上,效能比提升高达300倍。
新型存储代表着存算一体内技术的未来
目前能做存算一体的存储器包括Flash、SRAM、DRAM、RRAM(忆阻器)、MRAM(磁性存储器)等,不同技术路线各有优劣势,比如Flash具有密度比较高的优点,DRAM成本比较低,MRAM、RRAM等新型存储器除了存储密度较高之外,功耗也比较低等。未来随着人工智能对高性能、低功耗处理需求的不断增强,存算一体技术的开发和应用落地进程将会加速。
其中,在众多存储器中,新型存储器RRAM、MRAM等被格外看好,此前有业内人士对电子发烧友表示,RRAM、MRAM这两类新型存储器代表着存内计算的未来,不过因为技术比较新,目前在工艺成熟度和商业化上还需要一些耐心。
事实上RRAM、MRAM等已经在逐渐取得进展。MRAM是一种基于自旋电子学的新型信息存储器件,其核心结构由一个磁性隧道结和一个访问晶体管构成,和其他存储器相比,MRAM在运行速度、寿命和量产方面存在优势。事实上,早在十几年前就有企业研究和MRAM产品,包括飞思卡尔(被恩智浦并购)、东芝、高通等,过去几年台积电、英特尔、三星、SK海力士等晶圆代工厂和IDM也大力投入研发。
此外也有不少初创公司投入研究并取得进展,比如国外的Everspin、Avalanche、Crocus、 Spin Transfer Technology 已经能够提供MRAM样品,国内成立于2019年的亘存科技,已经于2020年完成产业链闭环建设,打通了上下游各关键环节,获得数家来自国内外客户的合作订单和营收,涉及技术涵盖STT-MRAM和 SOT-MRAM等。
RRAM是继电阻、电容、电感之后的第四种电路基本元件,这种组件的电阻会随着通过的电流量而改变,它本身就像一个矩阵排列,最适合进行点积乘法和累加运算,而这类运算占深度学习算法中的绝大部分。乘积累加操作可以通过将忆阻器这样的可编程阻变元件直接集成到非易失性高密度存储芯片中来实现,处理单元被嵌入存储器中,可减少数据移动,也就是说忆阻器本身就已具备存内计算的特质,非常适合用于存算一体芯片技术方向。
目前已经有些RRAM进入小批量试产阶段,而且此前清华大学微电子所、未来芯片技术高精尖创新中心钱鹤、吴华强教授团队,与合作者共同研发出一款基于多个忆阻器阵列的存算一体系统,该系统在处理卷积神经网络时的能效,比图形处理器芯片高两个数量级,单芯片算力高达1POPs,大幅提升计算设备的算力,而且功耗比传统芯片降低了100倍。
可以看到,新型存储器RRAM、MRAM等的优势非常明显,不过相比于Flash、SRAM、DRAM等存储器,它们在开发上还有一些问题需要攻克,从当前的进展来看,预计未来几年将会逐渐有产品走向商用。
小结
从统计情况来看,目前已经有基于SRAM、NOR Flash的存算一体产品批量生产,基本上是小算力产品,面向消费、泛安防等低功耗市场;此外可以看到,有不少企业正在研发面向边缘端、云端推理场景的大算力产品,应用于数据中心、智能驾驶等领域,并且已经到了芯片验证阶段,而接下来,除了基于新型存储器的存算一体将会逐渐走向商用,存算一体芯片产品也将从小算力终端消费类应用,逐渐走到面向大算力的智能驾驶、数据中心等应用。
原文标题:全球存算一体技术研究及量产情况最新进展
文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。
审核编辑:汤梓红
-
芯片
+关注
关注
455文章
50818浏览量
423718 -
台积电
+关注
关注
44文章
5637浏览量
166523 -
存算一体
+关注
关注
0文章
102浏览量
4302
发布评论请先 登录
相关推荐
评论