0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

20exaflops算力只有鞋盒大小,靠CMOS技术就能实现的超导处理器

E4Life 来源:电子发烧友 作者:周凯扬 2024-05-29 01:14 次阅读

电子发烧友网报道(文/周凯扬)随着摩尔定律失效,高性能计算芯片的规模进一步扩大,数据中心集群庞大的功耗已经成为我们不得不面临的问题。早在2015年SIA的预测中,到2040年全球计算资源的能源供给就不再具有可持续性,而如今随着人工智能的爆发,计算资源的需求更是猛涨。

以用于训练AI大模型的计算资源为例,每六个月翻倍的速度已经远超高性能计算集群的组建速度。无需等到2040年,到了2030年训练单个大模型所需的资源就将超过TOP500所有超算的算力总和,而所需要的电力供应也将达到国家级。解决能源可持续的问题已经避无可避了,但除非我们放缓发展速度,或是颠覆计算方式,是很难实现这一目标的。

对于应用层还没进入商业模式成熟和完全盈利的人工智能来说,放缓发展速度自然是不可取的。那么也就只剩下颠覆计算方式一途,而大幅降低能耗的超导计算,也就理所当然地成了多数研究的重点方向。

显著降低功耗,最大开销成为冷却

2020年,日本国立横滨大学的一个研究小组就展示了一个超导CPU,并成功实现了流片。该处理器主要采用约瑟夫森结架构打造,这是一种经典的超导三层器件架构,也是超导逻辑单元中取代晶体管的基础元件。因为其独特的物理特性,该器件工作时的开关功耗只有10-21J左右,这样一来动态功耗相比传统CMOS器件极大降低,加之超导体无电阻的特性,静态功耗无限趋近于零。

超导体的出现为降低功耗提供了最大的可能性,因为其在通过电流时并不会消耗能量。最大的能耗开支莫过于需要在低温下工作的冷却方案供电,比如超导芯片的处理单元,往往需要低至4K的冷却温度。但即便如此,几乎零电阻的互联、基于超短脉冲构建的数字逻辑,都为现代计算资源大规模扩展提供了足够的优势。

而且随着计算资源规模的扩大,冷却方案开销的边际成本也会越小,据imec研究表明,一旦达到数十petaflops,超导计算机相比传统的计算机就要节能了,而这样的算力要求,TOP500中排名前30的超算已经可以做到了。

而Imec近期发布了他们采用标准CMOS工艺制造的超导计算单元,基于该技术打造的处理器能效将是当下最高效芯片的100倍,甚至可以将一个数据中心级别的计算资源塞进鞋盒大小的系统中。

将超导带出实验室的方法——兼容现有的CMOS制造技术

尽管超导可以降低功耗提高计算密度,但对于目前的大部分研究来说,都只停留在实验室阶段,要想真正实现大规模量产无异于痴人说梦。比如上文提到的横滨国立大学超导CPU,就是基于超导铌实现的,这种材料在可预测的实验室环境中表现良好,但要想用于制造工艺中就存在不少难题了。

铌对传统半导体加工温度及其周围材料都很敏感,一加热就会失去超导能力,因此与标准CMOS工艺流程不兼容。为此,imec改用了氮化铌钛作为基础超导材料。氮化铌钛可以承受CMOS制造工艺所用的温度,而且与周围层的反应较少。

同时imec还为约瑟夫森结的势垒层选择了一个新材料,无定形硅。传统的约瑟夫森结势垒层材料,比如氧化铝等,可以在可控的条件下生长,但为了达到远高于CMOS工艺芯片的密度,就必须进一步压缩其厚度,可这么薄的氧化物已经到了无法制造的程度。无定形硅的出现,则允许使用更厚的势垒层,实现210nm这样的临界尺寸。

在电路层面,同样需要对逻辑和存储结构重新设计。Imec设计出了一种全新的逻辑架构,名为脉冲守恒逻辑,输入和输出的数量保持一致,且SFQ(单通量量子)的总数保持守恒。通过不同约瑟夫森结和电容的组合将SFQ引导至不同输出,从而产生我们常见的逻辑OR和AND。在Imec的设计中,SRAM也是基于约瑟夫森结重新设计的,不过DRAM还是采用传统的硅工艺,但也需要从室温降低至77K的低温环境,用于提高效率。

鞋盒大小的数据中心,也需要3D堆叠实现

在基于CMOS工艺打造的数字芯片上,随着缩小晶体管变得越来越困难,我们已经开始广泛利用3D堆叠技术提高性能。但由于芯片内部的超大功率和热量,堆叠方案已经逐渐面临更大的挑战,如何做好散热成了多数3D堆叠方案必须解决的首要问题。

对于基于超导体的芯片设计而言,同样可以借助3D堆叠来实现更高的密度。结合硅中介层和玻璃基板这样的先进封装技术,将超导处理单元与嵌入式超导SRAM和DRAM堆叠在一起。芯片的大部分都将浸没在液氮中,冷却至4K。

在imec的模拟中,他们将100块超导体芯片板打造堆叠在一起,中间只留出极小的空间,整个系统的体积大小只有20x20x12厘米,与一个鞋盒大小近似。但正是这样一个鞋盒大小的系统,总功耗只有500kW,却可以提供将近20exaflops(BF16)的算力。

而这仅仅是Imec路线图中第一套方案,在后续的产品中,会进一步缩小约瑟夫森结和互联的尺寸。未来通过进一步提高逻辑芯片的密度,芯片板的数量也会随之减少,这样提高性能的同时,也会降低工艺复杂性和成本。

写在最后

尽管超导计算让我们看到了可行的技术路线,但即便是imec也不认为超导数据技术会取代传统的CMOS计算,而只是作为部分特定应用补充。这一技术的主要应用场景还是在大型的数据中心,为人工智能和机器学习处理提供基于云端的训练推理等,因为只有这样的环境内才能有条件实现超导所需的冷却技术。在消费电子领域,传统的CMOS硅工艺依然不可取代。

值得一提的是,这一技术与Imec基于CMOS制造工艺的超导量子比特技术同样可以做到无缝集成,可以说是电子计算与量子计算的完美结合。但即便搞定了基础材料工程设计,以及架构的设计,还有电路开发设计这一环目前没有打通,需要EDA厂商为其开发特定的流程工具。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18613

    浏览量

    224582
  • CMOS
    +关注

    关注

    58

    文章

    5385

    浏览量

    233883
  • 算力
    +关注

    关注

    1

    文章

    732

    浏览量

    14454
收藏 人收藏

    评论

    相关推荐

    美室温超导作者被坐实造假,但室温超导技术研发并未停止

    室温超导技术,可以让物体在接近或等于常温常压的条件下实现超导电性,意味着材料能够在没有电阻的状态下传输电流,也意味着一旦实现这一
    的头像 发表于 04-09 00:11 2278次阅读

    imec推出超导处理器,基于现有的CMOS制造工具

    近日,IEEE Spectrum刊文指出,比利时imec微电子研究所在现有的CMOS制造工具基础上,成功研发出超导处理器。该超导处理器主要借
    的头像 发表于 05-27 17:52 487次阅读

    CMOS 2.0:为何CMOS技术迈入全新阶段?

    CMOS20 世纪 60 年代构建微处理器技术选择。使晶体管和互连器件变得更小,以使其更好地工作 60、70 年。但这种情况已经开始崩溃。
    发表于 03-11 09:27 302次阅读
    <b class='flag-5'>CMOS</b> 2.0:为何<b class='flag-5'>CMOS</b><b class='flag-5'>技术</b>迈入全新阶段?

    能RADXA微服务试用体验】Radxa Fogwise 1684X Mini 规格

    通过网络可以了解到,能RADXA微服务的具体规格: 处理器:BM1684X :高达32Tops INT8峰值
    发表于 02-28 11:21

    iBeLink KS MAX 10.5T大领跑KAS新领域

    有8G的显存,可以处理复杂的算法,提高挖掘稳定性。iBeLink ks max10.5T的超大特点是它的高效节能,它采用了先进的“存一体”高通量芯片,专为“大型复杂”的区的块的链
    发表于 02-20 16:11

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    上海微系统所助力研制超导神经形态处理器原型芯片—苏轼(SUSHI)

    中国科学院计算技术研究所尤海航研究员、唐光明研究员带领的研究团队与中国科学院上海微系统与信息技术研究所(以下简称“上海微系统所”)任洁研究员团队联合攻关,研制了超导神经形态处理器原型芯
    的头像 发表于 10-22 09:11 906次阅读
    上海微系统所助力研制<b class='flag-5'>超导</b>神经形态<b class='flag-5'>处理器</b>原型芯片—苏轼(SUSHI)

    什么是射频超导技术

    什么是射频超导(也称为超导高频)技术?大家知道,加速器无论大小,都有一个高频加速系统,是用来给高速的带电粒子提供动能使其加速或维持其能量的,相当于汽车的发动机,这是加速器的核心系统。这
    的头像 发表于 10-16 10:24 442次阅读
    什么是射频<b class='flag-5'>超导</b><b class='flag-5'>技术</b>?

    青稞处理器资料分享

    至中断函数执行,进一步减小中断响应延迟。 3.两线和单线调试接口 区别于RISC-V经典的4线JTAG调试接口,青稞处理器率先引入两线甚至单线的DTM接口,只需两个甚至一个I/O即可实现处理器的调试
    发表于 10-11 10:42

    ARM Cortex-R52+处理器技术参考手册

    Cortex-R52+处理器是一款中等性能的有序超标量处理器,主要用于汽车和工业应用。 它还适用于各种其他嵌入式应用,如通信和存储设备。 Cortex-R52+处理器有一到四个内核,每个内核
    发表于 08-29 07:33

    SylixOS正式支持异构算力(大小核)处理器

    Intel 2021 架构日活动中,首次公布了新一代处理器在 PC 平台上使用大小异质核心(Intel 称之为 P-Core 与 E-Core )的设计架构,类似 ARM 平台的 Big.LITTLE 大小异质核心机制
    发表于 08-15 10:40 956次阅读
    SylixOS正式支持异构算力(<b class='flag-5'>大小</b>核)<b class='flag-5'>处理器</b>

    若室温超导实现世界会发生啥改变

    若室温超导实现世界会发生啥改变 就目前而言想要实现常温超导仍然面临着技术上的挑战,包括材料设计和合成、制造成本、设备稳定性等问题。但是若室温
    的头像 发表于 08-03 15:17 2124次阅读

    ARM922T处理器技术参考手册

    高性能和高性能之间进行权衡代码密度。ARM922T处理器是哈佛高速缓存体系结构处理器,其目标是全内存管理、高性能和低功率是至关重要的。此设计中的独立指令和数据缓存每个大小为8KB,具有8字线长度。ARM922T
    发表于 08-02 15:44

    Arm Cortex-A32处理器高级SIMD和浮点支持技术参考手册

    Arm Cortex-A32 Cortex-ACortex‑A32处理器支持A32和T32指令集中的高级SIMD和浮点指令。 Cortex‑A32浮点实现: •不生成浮点异常。 •在硬件中实现所有
    发表于 08-02 14:50

    ARM920T处理器技术参考手册

    高速缓存体系结构处理器,适用于全内存管理、高性能和低功耗至关重要的多程序应用。此设计中的独立指令和数据缓存大小分别为16KB,具有8字线长度。ARM920T处理器实现了一个增强的ARM
    发表于 08-02 13:05