8月1日消息,又一支清华芯片团队取得重大突破!来自清华的“天机”类脑芯片架构登上了顶级学术杂志《自然(Nature)》封面。
28nm的天机芯片由156个FCores组成,面积为3.8×3.8毫米,包含大约40000个神经元和1000万个突触,可以同时支持机器学习算法和类脑电路。
据智东西了解,“天机”类脑芯片项目脱胎于清华精密仪器系,是清华精密仪器系教授、脑计算中心主任施路平教授带队主导的类脑芯片项目之一。
2018年1月,“天机”团队注册成立了北京灵汐科技,董事长兼CEO为祝夭龙。灵汐科技于2018年8月披露了其天使轮融资,投资方来自华控基石基金、优选资本、清华控股。
而本篇Nature论文的第一作者裴京也是灵汐科技的监事,施路平教授则为灵汐科技公司董事。
脱身清华,落地灵汐科技
这篇论文名为《面向通用人工智能的异构融合芯片架构“天机”(Towards artificial general intelligence with hybrid Tianjic chip architecture)》
这篇论文中介绍了清华团队的“天机”类脑芯片架构,它不仅算力高、功耗低、支持多种不同AI算法、而且采用了存算一体技术,不需要外挂DDR,能够节省成本功耗和空间。
在论文中,研究团队描述了这种芯片如何帮助机器响应语音命令,识别周围世界,避开障碍并保持平衡。
而在附上的视频中,“天机”团队还展示了搭载该芯片的自动驾驶自行车
是如何自动控制平衡、并在操场上对目标人物进行识别、跟随、自动避障。
施路平教授表示,此次发表在《自然》的论文是一个非常初步的研究,人工通用智能是一项非常具有挑战性的工作,目前还处于起步阶段。他和团队的研究愿景是——“发展类脑计算,支撑人工通用智能,赋能各行各业”。
据他透露,目前,团队已经启动了下一代芯片的研究,预期明年年初可以完成研发工作。
“天机”芯片技术拆解
“天机”是一种推进人工通用智能(AGI)发展的异构融合芯片架构,结合了神经科学导向和计算机科学导向方法的优点。
在论文中,作者用一个无人自行车系统验证了这一异构融合芯片的处理能力。试验中,仅用一个芯片,无人驾驶自行车系统即可同时处理多种算法和模型,不仅可以识别语音指令、实现自平衡控制,还能完成对前方行人的实时检测和跟踪,并完成自动过障、避障和平衡控制等任务。
据论文介绍,发展人工通用智能的方法主要有两种,一种基于计算机科学导向,另一种基于神经科学导向。
据负责芯片设计和算法细节的论文作者邓磊介绍,此前,市面上的深度学习加速器通常只支持计算机科学模型,神经形态芯片只支持神经科学模型。
两类方法依赖不同且不兼容的平台,在一定程度上延缓了人工通用智能的发展,因此需要一个可以支持通用的基于计算机科学的人工神经网络以及神经科学启发的模型和算法的通用平台。
研究团队由此提出天机芯片(Tianjic chip),同时支持计算机科学模型和神经网络模型。
邓磊表示,天机芯片能做到两者都支持,同时支持神经科学发现的众多神经回路网络和异构网络的混合建模。因为两类模型所使用的语言、计算原理、编码方式和应用场景都不相同,实现这两种模型深度高效的融合,是天机芯片设计中最大的挑战。
天机芯片采用多核架构、可重构的构建模块和采用混合编码方案的流线型数据流,不仅可以适应基于计算机科学的机器学习算法,还可以轻松实现脑启动电路和多种编码方案。
研究团队的一项重要创新是高度可重构的的统一功能核(FCore),它结合了人工神经网络和生物网络的基本构建模块——轴突、突触、树突和体细胞块。
28nm的天机芯片由156个FCores组成,面积为3.8×3.8毫米,包含大约40000个神经元和1000万个突触,可以同时支持机器学习算法和类脑电路。
天机芯片提供超过每秒610千兆字节(GB)的内部存储器带宽,以及运行人工神经网络的1.28 TOPS的峰值性能。
在生物启发的尖峰神经网络模式中,天机芯片实现了每瓦约650千兆每秒突触操作(GSOPS)的峰值性能。该研究团队还展示了与GPU相比的卓越性能,其中新芯片的吞吐量提高了1.6-100倍,电源效率提高了12-10000倍。
研究团队设计了一个无人驾驶自行车实验,来评估芯片整合多模态信息和做出迅速决策的能力。
该自行车配备天机芯片和IMU传感器、摄像头、转向电机、驱动电机、调速电机、电池。自行车可以执行实时物体检测、跟踪、语音命令识别、骑行减速带、避障,平衡控制和决策等任务。
研究小组开发了各种神经网络(CNN、CANN、SNN和MLP网络)来完成每项任务。这些模型经过预训练并编程到天机芯片上,可以并行处理模型,实现不同模型之间的无缝片上通信。
在实验中,采用天机芯片的无人驾驶自行车顺利完成了所有分配的任务,这标志着加速AGI发展的巨大飞跃。
研究小组还指出:“通过随机将新变量实时引入环境中可以产生高时空复杂性,例如不同的道路条件、噪声、天气因素、多种语言、更多人等等。通过探索允许适应这些环境变化的解决方案,可以检查对AGI至关重要的问题,比如概括、稳健性和自主学习。”
低功耗、低成本、高算力
在去年10月的安博会上,灵汐科技也向智东西展示了其110nm工艺的第一代、28nm的第二代“天机”架构的类脑芯片,主打云端智能市场。
灵汐科技告诉智东西,由于绕过了HBM内存技术对AI芯片性能和成本的限制,灵汐科技的芯片与市场同类产品比起来,具备低功耗、低成本、高计算力的优势。
“天机”架构采用优化过的众核架构,由一系列核构成阵列完成神经网络的计算。在摩尔定律即将失效的今天,在现有的工艺基础上,从优化架构入手可能是提高芯片性能最重要的手段。
据灵汐科技介绍,“天机”架构已经超越了传统的冯诺伊曼结构,不像传统架构的芯片一样在计算的时候必须与DDR进行大量的数据交互而受存储带宽的限制,使整个芯片的性能受到影响。
这也是“天机”架构芯片算力高的一个极其重要的原因。因为不用从外部导入数据,因此它的功耗比较低,也节省了成本和空间。
结语:类脑芯片,AI计算新蓝海
类脑芯片其实并不是一个新话题了。早在2014年,IBM就推出了业内首款类脑芯片TrueNorth。目前国内外有许多公司和机构正在类脑芯片研发上投入大量精力。
据灵汐科技介绍,与当前市面上其他AI芯片架构相比,“天机”类脑芯片的主要优势有:
1、算力高;
2、功耗低;
3、存算一体,不需要外挂DDR,节省成本功耗和空间;
4、算法的支持度灵活,既能高效支持人工神经网络算法,又能高效支持SNN算法;
5、扩展性好,能得到极大算力的芯片阵列,而且算力效率不会下降;
6、支持多核重组特性,可以实现多任务并行处理。
就在今年7月16日,英特尔也发布了“Pohoiki Beach”芯片系统,该系统主要由Loihi神经拟态芯片构成,可处理深度学习任务,速度比CPU快1000倍,效率高10000倍,耗电量小100倍。
Pohoiki Beach系统由64块Loihi芯片的800万个所谓的神经元构成。Loihi芯片是英特尔公司2017年首次推出的AI芯片,是一款模仿人类大脑的神经拟态芯片。
相比于传统芯片,类脑芯片的确在功耗上具有绝对优势,完成同一个任务所消耗的能源有时甚至比传统芯片节省高达1000倍。
同时类脑芯片的集成度也非常高,拿浙大推出的“达尔文”芯片来说,其面积为25平方毫米,也就是说边长只有0.5厘米,但内部却能包含500万个晶体管。
随着行业对计算力要求越来越高,冯氏瓶颈将越来越明显,颠覆传统架构的类脑芯片已为芯片行业开启了一扇新的大门。
本文来自智东西微信号,本文作为转载分享。
评论
查看更多