0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中科院提出名为“Zhejiang”的大芯片将使用22 纳米工艺制造

半导体产业纵横 来源:半导体产业纵横 2024-01-05 16:23 次阅读

据中科院研究人员介绍,名为“Zhejiang”的大芯片将使用22 纳米工艺制造。

真正的摩尔定律,即晶体管随着工艺的每次缩小而变得更便宜、更快,这就是正在让芯片制造商抓狂的事。有两种不同的方法可以制造容量更大但通常不是更快的计算引擎,将设备分解成小芯片并将它们连接在一起或将它们蚀刻在整个硅晶圆上,再加上第三种覆盖层,这两种方法都可以与 2.5D 和 3D 堆叠一起使用。芯片以扩展容量和功能。

无论如何,所有这些方法都受到用于蚀刻芯片的光刻设备的掩模版限制的限制。

目前的设备是针对 300 mm 硅片定制的,该屏障为 858 mm2,仅此而已。没有任何芯片可以蚀刻得比这更大。在过去的三十年里,从 150 毫米晶圆到 200 毫米晶圆到 300 毫米晶圆并没有改变掩模版极限,从可见光光刻到水浸光刻再到极紫外光刻也没有改变掩模版极限。假设转向 450 毫米晶圆也不会改变掩模版限制。到 2023 年,拥有 450 毫米晶圆将允许更大容量的晶圆级计算引擎。但 450 毫米晶圆的工程挑战对于 IBM、英特尔三星、台积电、GlobalFoundries 和尼康来说太难解决,但这一努力于 2015 年被放弃。

光罩限制(光穿过芯片掩模以在硅晶圆上蚀刻晶体管的孔径大小)不仅定义了小芯片的设计方式,而且还限制了离散计算和内存块的大小单个晶圆。如果我们有 450 毫米的晶圆,并且晶圆级计算机的所有逻辑都可以用比晶圆更大的掩模版一次性蚀刻,那将是令人惊奇的,但这不是光刻设备的工作原理。总而言之,小芯片和晶圆级之间的区别实际上在于如何构建互连,以利用计算和内存的离散元件来构建计算引擎插槽。

尽管存在这样的限制,业界始终需要构建更强大的计算引擎,并且在摩尔定律结束时,如果能够找到一种方法,让这些设备的制造成本也更低,那就太好了。

中国科学院(CAS)计算技术研究所的研究人员刚刚在《基础研究》杂志上发表了一篇论文,讨论了光刻和小芯片的局限性,并提出了一种他们称之为“大芯片”的架构,该架构模仿了晶圆级Trilogy Systems 在 20 世纪 80 年代的努力以及Cerebras Systems 在 2020 年代成功的晶圆级架构。埃隆·马斯克 (Elon Musk) 的特斯拉正在打造自己的“Dojo”超级计算机芯片,但这不是晶圆级设计,而是将Dojo D1 核心复杂地封装成某种东西,如果你眯着眼睛看,它看起来就像是由 360 个小芯片构建的晶圆级插槽。也许通过 Dojo2 芯片,特斯拉将转向真正的晶圆级设计。看起来并不需要做很多工作就能完成这样的壮举。

中国科学院整理的这篇论文讨论了很多关于为什么需要开发晶圆级器件的问题,但没有提供太多关于他们开发的大芯片架构实际上是什么样子的细节。它并没有表明大芯片是否会像特斯拉对 Dojo 那样采用小芯片方法,或者像 Cerebras 从一开始就一路向晶圆级发展。

研究人员表示,该设计能够在单个分立器件中扩展至 100 个小芯片,我们过去称之为插槽,但对我们来说听起来更像是系统板。目前尚不清楚这 100 个小芯片将如何配置,也不清楚这些小芯片将实现什么样的内存架构(阵列中将有 1,600 个内核)。

我们所知道的是,随着大芯片的迭代,有 16 个 RISC-V 处理器使用芯片上的网络在共享主内存上进行对称多处理,相互连接,并且小芯片之间有 SMP 链接,因此每个块可以在整个复合体中共享内存。

以下是RISC-V 小芯片的框图:

以下是如何使用中介层将 16 个小芯片捆绑在一起形成具有共享内存的 256 核计算复合体,从而实现芯片间 (D2D) 互连:

CAS 研究人员表示,绝对没有什么可以阻止这种小芯片设计以晶圆级实现。然而,对于这次迭代,看起来它将是使用 2.5D 中介层互连的小芯片。

互连与计算元件一样重要,这在系统和子系统设计中始终如此。

“该接口是使用基于时间复用机制的通道共享技术设计的,”研究人员在谈到 D2D 互连时写道。“这种方法减少了芯片间信号的数量,从而最大限度地减少了 I/O 凸块和内插器布线资源的面积开销,从而可以显着降低基板设计的复杂性。小芯片终止于顶部金属层,微型 I/O 焊盘就建在该金属层上。”

虽然一个大芯片计算引擎作为多芯片或晶圆级复合体可能很有趣,但重要的是如何将这些设备互连以提供百亿亿级计算系统。以下是 CAS 研究人员对此的看法:

研究人员在谈到这种计算和内存的分层结构时写道:“对于当前和未来的亿亿级计算,我们预测分层小芯片架构将是一种强大而灵活的解决方案。”如下图所示,这段来自 CAS 的长篇引用纸。“分层小芯片架构被设计为具有多个内核和许多具有分层互连的小芯片。在chiplet内部,内核使用超低延迟互连进行通信,而chiplet之间则以得益于先进封装技术的低延迟互连,从而在这种高可扩展性系统中实现片上延迟和NUMA效应可以最小化。存储器层次结构包含核心存储器、片内存储器和片外存储器。这三个级别的内存在内存带宽、延迟、功耗和成本方面有所不同。在分层chiplet架构的概述中,多个核心通过交叉交换机连接并共享缓存。这就形成了一个pod结构,并且pod通过chiplet内网络互连。多个pod形成一个chiplet,chiplet通过chiplet间网络互连,然后连接到片外存储器。需要仔细设计才能充分利用这种层次结构。合理利用内存带宽来平衡不同计算层次的工作负载可以显著提高chiplet系统效率。正确设计通信网络资源可以确保小芯片协同执行共享内存任务。”

很难反驳这句话中所说的任何内容,但 CAS 研究人员并没有说明他们将如何实际处理这些问题。这是最困难的部分。

有趣的是,该图中的内核被称为“可编程”和“可重新配置”,但我们不确定这意味着什么。它可能需要使用可变线程技术(例如 IBM 的 Power8、Power9 和 Power10 处理器)来完成更多工作,而不是在核心中混合使用 CPUFPGA 元件。

CAS 研究人员表示,大芯片计算引擎将由超过 1 万亿个晶体管组成,占据数千平方毫米的总面积,采用小芯片封装或计算和存储块的晶圆级集成。对于百亿亿级 HPC 和 AI 工作负载,我们认为 CAS 很可能正在考虑 HBM 堆叠 DRAM 或其他一些替代双泵浦主内存,例如英特尔和 SK Hynix 开发的 MCR 内存。RISV-V 内核可能会有大量本地 SRAM 进行计算,这可能会消除对 HBM 内存的需求,并允许使用 MCR 双泵浦技术加速 DDR5 内存。很大程度上取决于工作负载以及它们对内存容量和内存带宽的敏感程度。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    456

    文章

    50873

    浏览量

    424074
  • 晶体管
    +关注

    关注

    77

    文章

    9698

    浏览量

    138282
  • 晶圆级
    +关注

    关注

    0

    文章

    34

    浏览量

    9878

原文标题:晶圆级大芯片,中科院提出

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【「大话芯片制造」阅读体验】+ 芯片制造过程和生产工艺

    今天阅读了最感兴趣的部分——芯片制造过程章节,可以用下图概括: 芯片制造工序可分为前道工序和后道工序。前道工序占整个芯片
    发表于 12-30 18:15

    大话芯片制造之读后感超纯水制造

    大家能看到这篇读后感,说明赠书公益活动我被选中参加,我也算幸运儿,再次感谢赠书主办方! 关于芯片制造过程中,超纯水设备制造工艺流程中导电率控制。在正常思维方式,水是导电的,原因导电是水
    发表于 12-20 22:03

    7纳米工艺面临的各种挑战与解决方案

    来说,纳米通常指的是晶体管的最小尺寸,或者是构成芯片中各个功能单元的最小结构尺寸。因此,7纳米工艺指的是在芯片
    的头像 发表于 12-17 11:32 383次阅读

    【「大话芯片制造」阅读体验】+芯片制造过程工艺面面观

    第二章对芯片制造过程有详细介绍,通过这张能对芯片制造过程有个全面的了解 首先分为前道工序和后道工序 前道工序也称扩散工艺,占80
    发表于 12-16 23:35

    名单公布!【书籍评测活动NO.50】亲历芯片产线,轻松图解芯片制造,揭秘芯片工厂的秘密

    供应商改进设备及材料后,重新提供新一代的生产工艺。双方共同解决问题,促使工艺水平螺旋式上升,开启制造的良性循环。一代又一代工程师艰辛努力,挑战一个接一个的人类极限,促使芯片
    发表于 11-04 15:38

    上海光机所提出基于空间啁啾实现相干合束焦斑改善新方案

    图1.原理示意图 近日,中科院上海光机所强场激光物理国家重点实验室,提出了一种基于空间啁啾来改善相干合束激光装置远场光斑的新方案,相关研究成果以Power-in-bucket enhancement
    的头像 发表于 09-14 06:25 217次阅读
    上海光机所<b class='flag-5'>提出</b>基于空间啁啾实现相干合束焦斑改善新方案

    【龙芯2K0300蜂鸟板试用】1 龙芯中科必知3件事

    听说,当第一时间看到申请试用时,对其充满好奇,网上各种了解,终于了解其历史沿革,对其肃然起敬,希望它能真正撑起中国的未来之芯。 龙芯中科源于中科院计算所的芯芯课题组,最初采用MIPS指令,经过20多年
    发表于 08-12 21:21

    中科院重庆研究在势垒可光调谐新型肖特基红外探测器研究获进展

    传统肖特基探测器和势垒可光调谐的肖特基红外探测器的对比 近日,中科院重庆绿色智能技术研究微纳制造与系统集成研究中心在《创新》(The Innovation)上发表了题为Schottky
    的头像 发表于 06-25 06:27 301次阅读
    <b class='flag-5'>中科院</b>重庆研究<b class='flag-5'>院</b>在势垒可光调谐新型肖特基红外探测器研究获进展

    中科院半导体所在高性能电泵浦拓扑激光器研发方面获进展

    优点成为研究热点,但基于电注入的拓扑激光器仍处于研究起步阶段。因此,发展出提高电泵浦拓扑激光器输出功率的设计思路和技术方案至关重要。 近期,中科院半导体研究所研究员刘峰奇团队在高性能电泵浦拓扑激光器研发方面取得进展。该研究创新性
    的头像 发表于 06-18 06:33 371次阅读
    <b class='flag-5'>中科院</b>半导体所在高性能电泵浦拓扑激光器研发方面获进展

    为什么45纳米至130纳米工艺节点如此重要呢?

    如今,一颗芯片可以集成数十亿个晶体管,晶体管排列越紧密,所需的工艺节点就越小,某些制造工艺已经达到 5 纳米甚至更小的节点。
    的头像 发表于 04-11 15:02 661次阅读
    为什么45<b class='flag-5'>纳米</b>至130<b class='flag-5'>纳米</b>的<b class='flag-5'>工艺</b>节点如此重要呢?

    产学研深度融合,创新印刷电子未来|绿展科技团队阶段性科研成果介绍

    绿展科技、中科院苏州纳米所、广东中科半导体微纳制造研究共同成立了“纳展微电子精密印刷制造联合实
    的头像 发表于 03-21 16:09 575次阅读
    产学研深度融合,创新印刷电子未来|绿展科技团队阶段性科研成果介绍

    中科加禾完成天使轮数千万元融资,专注编译技术,推动国产算力和大数据发展

    创办于2023年的中科加禾,依托中科院计算所的雄厚科技实力,倾心于编译技术,旨在填补国产芯片生态系统的空缺,助力国产算力和大模型应用推广,推动我国人工智能产业的快速发展。其主营业务涵盖大模型训练推理加速及算子自动生成工具两大板块
    的头像 发表于 03-19 16:49 1116次阅读

    三星半导体将其“第二代3纳米工艺正式更名为“2纳米”!

    近期,科技巨头三星半导体做出了一个引人注目的决策:将其“第二代3纳米工艺正式更名为“2纳米”。
    的头像 发表于 03-06 13:42 1115次阅读

    湖南大学校长、王耀南院士一行赴中科亿海微调研指导

    、企业文化及发展概况,双方就半导体芯片领域国家战略需求、未来产业合作等方面开展深入座谈交流。中科亿海微主要从事可编程芯片及可重构系统产品研发及产业化,核心团队来自中科院
    的头像 发表于 02-19 12:17 868次阅读
    湖南大学校长、王耀南院士一行赴<b class='flag-5'>中科</b>亿海微调研指导

    龙芯中科中科信息签订合作框架协议

    1月24日,龙芯中科技术股份有限公司与中科院成都信息技术股份有限公司(以下简称“中科信息”)合作框架签约仪式在成都兴隆湖畔科学城园区举行。
    的头像 发表于 01-26 11:44 828次阅读