Computing in Memroy是在DRAM中嵌入逻辑电路,打造“存算一体”架构,存算一体架构会大幅降低资料在存储器与处理器之间往返的负担,降低芯片的能耗。
集微网消息,不久前,合肥恒烁半导体有限公司与中科大团队历时两年共同研发的基于NOR闪存架构的存算一体(Computing In Memory)AI芯片系统演示顺利完成,标志着具有我国自主知识产权,国内首创、国际领先的超低功耗存算一体的人工智能芯片正式问世。
目前市面存在的基于CPU、GPU等的计算系统都是基于冯诺依曼结构,其运算与存储部件是分离的,进行计算时,计算单元需要将数据从存储单元中提取出来,处理完成后再写回存储单元,这种结构导致了密集数据计算时需要在存储部件与计算部件传输大量数据,这就造成计算速度受到数据传输带宽限制,同时引起功耗增加,限制了计算系统的性能提升。另一方面,现有的CPU、GPU等处理器都是使用数字电路实现计算功能,因而需要大量的计算资源,这也限制了可以达到的计算并行度以及计算速度。合肥恒烁半导体研制的这款芯片则将存储与计算结合在一起,打破了冯诺依曼结构的限制,对未来计算机结构的发展具有重要意义。
早在2018年3月9日,合肥恒烁半导体公司就提出一项名为“一种基于NOR Flash模块的数据运算方法”的发明专利(申请号:201810193765.X),申请人为合肥恒烁半导体有限公司。
此发明专利提供了一种基于NOR Flash模块的数据运算方法,实现了基于NOR Flash存储单元的乘加运算,即“存算一体”的结构,同时提高了中央处理器的计算速度,并进一步降低了功耗。
图1 基于NOR Flash模块的数据运算方法
此专利提出的基于NOR Flash模块的数据运算流程如图1所示,其中NOR Flash模块是计算和存储的物理主体位置,包含多个由集成电路构成的存储单元,通常为MOS管,这种成熟的集成电路结构一方面可以利用电荷充放电的特性进行数据存储,另一方面可以对电压或电流进行处理计算达到计算功能。当模块存储有数据后,步骤S1000获取存储单元的初始参数,并对存储单元阈值电压进行编程,并获取电压随编程操作的变化曲线;S2000根据上述曲线,对存储单元的阈值电压进行调整;步骤S3000向所述存储单元的输入端输入数据参数;步骤S4000根据调整后的阈值电压以及数据参数,利用预设算法获取存储单元的输出数据参数;步骤S5000根据上述输出数据参数,对存储单元中的数据进行运算处理,并通过测量电路测量输出。
图2 NOR型闪存单元结构图
此专利提出的系统采用图2所示的存储单元结构,类似于现有的集成电路中的MOS结构,包括栅端、源端和漏端,其氧化程度、PN密度等物理结构的差异导致了初始参数不同。对其进行编程和擦除操作等效于改变存储单元结构中存储的电荷量,进而导致阈值电压变化,而通过NOR Flash模块可以对其内部存储的数据和外部输入的数据进行计算,如乘加运算。同时,NOR Flash模块可以作为整体封装成芯片,或以模块的形式嵌入到其他芯片中,并添加相应外设电路配合使用。
图3 数据运算方法实例结构图
图3是此专利提出的两种简单的实例结构图,左侧为MOS管组成的电流镜,右侧结构的输出电流通过ADC转换为数字信号。以左侧电流镜为例,MOS管漏端输入电流信号,存储单元漏端输入电压信号,并向另一侧漏端输入等幅电压信号,并获取电流镜式的存储单元输出数据参数。
“存算一体”芯片的诞生相对现有的计算机结构体系是一个质变的过程,而这一革新出现在了国内企业则代表着中国正在紧紧追赶技术发展热潮并获得显著效果,也坚信国内的企业定会在这一领域定会再创成就。
-
闪存
+关注
关注
16文章
1791浏览量
114975 -
DRAM
+关注
关注
40文章
2316浏览量
183592 -
AI
+关注
关注
87文章
31042浏览量
269390
发布评论请先 登录
相关推荐
评论