高性能计算、人工智能等应用推动芯片的技术节点不断向前迈进,导致设计、制造的难度 和成本问题凸显,针对这一问题,Chiplet 技术应运而生。Chiplet 技术是将复杂的系统级芯片按 IP 功 能切分成能够复用的“小芯片 (芯粒)”,然后将执行存储和处理等功能的小芯片以超高密度扇出型封 装、2.5D 和 3D 高端性能封装进行重新组装,以实现高性能计算对高带宽、高性能的要求。介绍了上 述封装的多样化形式和通信协议,分析其重要的电连接结构与工艺难点,及其在可靠性方面的一些问题。
引言
高性能计算、人工智能、5G 通信、数据中心和云计 算的快速发展使芯片的技术节点不断向前推进,单颗 芯片上集成的晶体管数目已超过百亿级。与此同时, 将更多功能集成在单颗芯片的难度不断增大,设计与 制造的成本不断上升。与 90 nm 技术节点相比,3 nm技术节点的投资成本增加了 35~40 倍,仅英特尔 (Intel)、台积电(TSMC)和三星(Samsung)3 家头部企 业参与其中。5 nm 技术节点的设计成本超过 5 亿美 金,约是 28 nm 的 10 倍。为解决上述问题,出现了 Chiplet 概念。
Chiplet 作为一种设计概念,指将单颗集成复杂功 能的片上系统级芯片(SoC)离散成多颗特定功能的小 芯片(Chiplet,又称“芯粒”),再采用封装技术将其整合 在一起,构成多功能的异构系统级封装(SiP),以持续 提高器件算力,缩短产品开发周期,提升产品良率,降 低整体成本。近年来,受限于高端设备和材料的能力 等,以 Chiplet 方式将处理芯片与存储芯片封装集成的 技术越来越重要。目前,TSMC、Intel、Samsung 等均已 发布相关产品,通过高密度(≥16 /mm2)和窄节距(≤ 130 μm)的输入 / 输出接口(I/O)为处理芯片与存储芯 片提供定制化的封装,以应对高性能计算、人工智能、 数据处理等前沿行业的要求。市场研究公司 Yole 根 据产品的终端应用特点,将为追求最优计算性能而采 用的先进封装平台技术归类为高端性能封装,高端性 能封装主要包括超高密度扇出型封装(UHD FO)、嵌 入硅桥技术、2.5D 硅转接板技术、3D 存储堆叠和混合 键合技术。加入封测行业交流群,加VX:tuoke08。2021—2026 年,全球封装市场总额预计将 达到 960 亿美元,复合年增长率保持在 3.8%。同时, 先进封装的营收将超过传统封装。而以 FO、2.5D 和 3D 封装为代表的高端性能封装,在人工智能、5G 通信 和高性能计算等产业的推动下,其复合年增长率将超 过 10%,呈现高速增长的态势。
本文介绍了高端性能封装的主要技术形式,剖析 了其结构的特点,分析了其在设计、工艺和可靠性测 试方面所面临的挑战。
2 高端性能封装的结构
高端性能封装主要以追求最优化计算性能为目的,其结构主要以 UHD FO、2.5D 和 3D 先进封装为 主。在上述封装结构中,决定封装形式的主要因素为 价格、封装密度和性能等。
由 TSMC 在先进封装上的主要业务可知,推动高 端性能封装的主要项目为高性能计算与高带宽存储, 其代表结构为基于硅转接板的芯片在晶圆基板上的 封装(CoWoS@-S),是一种典型的 2.5D 封装结构。该 结构将处理芯片和存储芯片平铺在硅转接板上,采用 线宽 / 线间距为 0.4 μm /0.4 μm 的金属布线将其互 连。TSMC 突破光罩对硅转接板面积的限制,结合集成 芯片的数量,制定了其在 2.5D 封装上的发展路线。 Intel 和 Samsung 在 2.5D 封装上,也具有类似的封装结构。对于 2.5D 封装而言,硅转接板可提供亚微米 级高密度布线,能够显著提升多芯片的组装密度。随 着高带宽存储芯片的数据传输效率逐步提升,采用 2.5D 封装连接存储芯片和处理器芯片将成为主流的 选择。然而,硅转接板采用前道晶圆制造的设备和工 艺,制作成本相对昂贵。为此,一些企业在 FO 封装的 基础上进一步深耕,开发出多样化的结构,以满足一 些稍低端产品的需求。
FO 通过晶圆重构技术,将多颗相同或不同的芯 片灵活组合起来,以实现多芯片集成的目的。在此基 础上,FO 采用高密度布线有机层、硅桥和高速基板等 来提升器件的性能,衍生出了 2D、2.1D、2.2D 和 2.3D 封装结构,以实现超高密度 I/O 的连接。由于 FO 主要采用高分子材料来制造芯片间的微米级布线,其 自身的线宽 / 间距的尺寸极限也相对明显。为进一步 缩小 FO 封装的布线尺寸,新的设备与材料有待开发, 同时,封装成本也将大大提高。因此,FO 封装主要应 用在性能相对较低的存储器与处理器芯片上。
在高端性能封装中,处理芯片和存储芯片对高带 宽、低延迟有严格的要求,3D 封装是最理想的方案。目 前,常见的 3D 封装结构为存储芯片间垂直互连以及 存储芯片与逻辑芯片间的连接。在上述结构中,除采 用微凸点的芯片堆叠(C2C)和晶圆上芯片(C2W)工艺 外,基于硅通孔和混合键合(HB)的无凸点工艺实现了 异构异质芯片间的最短距离互连,将器件性能提至最 优,其投资成本也最高。预计在 2023 年,TSMC 采 用 HB 的集成芯片系统封装(SoIC)将率先实现量产。
随着高端性能封装技术的发展,不同维度封装结 构间的界限将变得模糊,将其集合成一个系统的 SiP 会变得普遍,图 1 为集成多维度封装的 SiP 结构示意 图。例如 Intel 的最新产品 Ponte Vecchio 集成了嵌入 式多芯片互连桥接技术(EMIB)和逻辑晶圆 3D 堆叠 技术(Foveros);TSMC 的 SoIC 也可与 CoWoS 和集成 扇出型叠层封装(InFO-PoP)相结合并共同使用。上述 结构可以实现器件对性能的极致追求,同时,多颗处 理芯片的集成也为器件的热耗散带来巨大挑战。
3 高端性能封装的通信协议与设计
在高端性能封装结构中,多颗特定功能的芯片(Die)被集成在单个系统之中,上述芯片的连接已成为 迫切需要解决的问题。Intel 公司开发了一种开放性的 通用小芯片互连技术(UCIe),为异构的小芯片间提供 了高带宽、低延迟、高电源效率和高性价比的封装连接。该标准结合外围元器件互连总线标准(PCIe)、计 算链接协议(CXL)和软件基础设施来确保互操作性, 使得设计者能够对不同来源的芯片进行封装,UCIe 的 分层与封装形式如图 2 所示。
UCIe 技术标准提供了协议层、适配器和物理层。芯片与芯片间的适配器为 Chiplet 提供链路状态管理 和参数协商。物理层提供电信号、时钟、链路训练、边 带、电路架构和封装互连通道等。上述技术适用于标 准的 2D 封装和先进的 2.5D 封装。在先进的高端性能 封装中,处理芯片对信道宽度最为敏感,其与存储芯 片的数据发射与接收端沿芯片的边缘放置,双向的导 线长度也保持一致,这样不仅简化了电路设计,还大 大降低了信道带宽的损耗。随着处理芯片对带宽要求 的进一步提升,存储芯片的 3D 封装得到发展,与之相 应的 UCIe 标准还需不断升级,扩展到 3D 封装互连。
在国内,中国计算机互连技术联盟联合数+家企 业和科研院所制定了应用计算机系统芯片内、芯片 间、系统间互连技术的协议规范和标准,即《小芯片接 口总线技术要求》。该标准描述了处理芯片、人工智 能芯片、网络处理器和网络交换芯片等应用场景的小 芯片接口总线技术要求,通过对链路层、适配层、物理 层进行详细定义,实现小芯片之间的互连互通。上述 标准于 2022 年 12 月发布,为 Chiplet 的芯片设计和封 装打下了基础,其在高端性能封装中的应用尚未有报道。
4 高端性能封装的电连接结构与工艺
传统的通信协议可用于规定芯片封装的 I/O 设 置,其中,最常用的是 PCIe。芯片间的带宽速率每 4 年 增加 1 倍,迫使芯片需要更多的 I/O,与之相应的封装 互连结构需要逐年缩小。在高端性能封装中,芯片的 I/O 数目随着芯片技术节点的推进不断增多,与之相 应的连接结构主要为凸点、高密度布线和中介层。
4.1 高端性能封装的凸点结构
I/O 密度与凸点节距、结构的关系如图 3 所示,传 统的可控塌陷芯片连接焊球已无法满足高端性能封 装对高密度 I/O 的要求,取而代之的是节距小于 100μm 的微凸点。目前,常用的微凸点连接结构有铜-锡-铜、 镍-锡-镍、铜-锡-镍、铜-镍-锡-镍-铜和铜-铜。在 热压键合工艺中,微凸点的最小节距甚至可以缩小至 10 μm,混合键合工艺又使凸点节距小于 10 μm。除 晶圆间的混合键合外,C2C 和 C2W 混合键合技术在 近年来受到青睐。除可获得最优的电性能外,该技术 可选择已知合格芯片进行贴片,以提升整体良率,降 低制造成本。由于 C2C 和 C2W 混合技术涉及晶圆切 割,如何保护化学机械抛光后的芯片表面免受污染、 同时提升键合界面的强度问题仍需解决。已有的报道 在切割过程中采用光刻胶遮住芯片表面,再采用等离 子体进行后处理,产品的封装良率尚无法满足工业批 量生产的要求,上述问题有待更多的研究。
4.2 高端性能封装的高密度布线
在高密度布线方面,2.5D 与 3D 封装可以与前道 晶圆制造共用已成熟的制程,其线宽 / 间距在微米级 以下,达到最高的布线密度。以 FO 为基础的 2D、 2.1D、2.2D 和 2.3D 封装更接近封测企业的制程。FO 将芯片埋入模塑料中以重构晶圆,大量的模塑料不仅 不利于器件的散热,还与芯片间存在热失配的问题, 导致晶圆发生严重的翘曲,同时,包裹金属布线的高 分子介电层又加剧了上述现象,给工艺带来了较大挑战。除晶圆翘曲外,模塑料在成形过程中收缩,带动 芯片偏离设定位置,造成曝光偏移,不利于高密度布 线的制作,需要新的设备投入。作为 FO 封装的重要 连接结构,高密度布线在工艺上亦存在较高难度。特 别在多层布线的制作过程中,底层布线的拱起妨碍上 层光刻胶的曝光和刻蚀,造成布线缺陷。金属布线在 电镀后的种子层过刻蚀亦会造成其与介电层的剥离。目前,在 FO 封装结构中,4 层布线宽度 / 间距为 5 μm / 5 μm 的产品已进入量产阶段,同时,布线宽度 / 间距 的尺寸极限为 1 μm /1 μm,层数最多为 6 层,难以满 足更高 I/O 密度的芯片间连接。据报道,有学者采用 聚酰亚胺的大马士革工艺来制作亚微米布线,提升介 电层层数,上述研究尚未在量产中广泛应用。
4.3 高端性能封装的中介层
在高端性能封装中,中介层作为重要的连接结 构,可大幅提高芯片的集成度。目前,中介层按材料成 分分为有机中介层与无机中介层。其中,有机中介层 主要采用高分子材料制作高密度布线,将其置于芯片 与基板之间,作为 2.5D 硅转接板的一种廉价的替代方 案,同时降低了在基板上制造细线宽 / 窄间距布线的 难度,如 Samsung 开发出的制板级封装转接板和TSMC 基于 FO 的集成基板。
无机中介层包括硅桥、硅转接板和玻璃转接板。在高带宽存储芯片和处理芯片间,存在局部的高密度 连接。Intel 根据上述结构特点,开发出硅桥结构,将其 埋入基板,仅连接高密度 I/O 部分,其余的布线连接由基板完成。部分企业则将硅桥与 FO 封装相结合,开 发出新的封装结构。据日月光的报道,与布线宽度 / 间 距为 0.8 μm /0.8 μm 的 2.5D 封装相比,采用布线线宽/ 间距为 2 μm /2 μm 的嵌入硅桥的扇出型基板上芯片 封装(FOCoS-B)表现出更优的电性能。在 2.5D 封装 中,硅转接板为芯片平面互连提供了媒介。台积电 CoWoS@-S 封装路线如图 4 所示,按照 TSMC 推出的 存储芯片与逻辑芯片的组合方式,2023 年硅转接板的 平面面积将达到 2011 年转接板面积的 4 倍,如何将大 尺寸的转接板贴在基板之上而无贴片偏移和虚焊等 问题尚待解决。另外,硅作为一种半导体材料,不利 于信号的传输与完整性保持。TSMC 通过在硅转接板 上制作电容以弥补上述不足,但金属布线形成的电容 容量有限,无法满足广泛的应用需求。近年来,有学 者提出采用绝缘材料如玻璃替换硅,而在玻璃转接板 上制作多层亚微米级布线并提高集成度仍需要进一步探索。
5 高端性能封装的可靠性
在高端性能封装中,产品常常采用叠层结构,且 存在大量用于信号连接的微结构,这使得封装体具有 多材料、多界面和尺寸跨度大等特点,其在热、力和电 学方面均存在较大的挑战。
5.1 高端性能封装中的热失配问题
在高端性能封装中,芯片主材硅、金属和高分子 材料间的热失配问题普遍存在,由此导致封装结构在 边角处出现焊球疲劳、模塑料开裂和底填料界面分层 等现象,2.5D 封装结构的失效现象如图 5 所示。在 上述问题中,FO 封装在降低焊球热疲劳方面具有优势,大量的模塑料使得结构的热膨胀系数增大至接近 基板的水平,两者在热胀冷缩过程中保持协调变形, 焊球的应力降低,使得结构在可靠性测试时表现良好。同时,模塑料的比重小,降低了焊球在振动与跌 落过程中的惯性,有助于封装结构在上述测试时保持 完整。相比于 FO 封装,2.5D 和 3D 封装的叠层结构自 身比重大,不仅不利于散热,而且其与基板间协调变 形的难度增加了,不断增大的 2.5D 硅转接板尺寸加剧 了该现象。此外,采用模塑料对 FO、2.5D 和 3D 封装产 品进行外保护,硅芯片与模塑料间会由于热失配导致 模塑料开裂,事先使用有限元工具对模塑料的材料进 行选择是一种合适的解决方案。
5.2 微结构的热电迁移
随着封装尺寸的不断缩小,微凸点和高密度布线 作为高端性能封装的重要电连接结构,其热电迁移问 题日益突出。在高性能产品的 2.5D 和 3D 封装中,微 凸点的直径(10~20 μm)比传统的焊球缩小一个数量 级。在 0.05 A 的小电流条件下,通过结构横截面的电 流密度约为 104A/cm2,接近锡层电迁移发生的阈值。此外,在产品服役过程中,结构中的锡、银将完全转化 为金属间化合物,造成体积收缩和柯肯达尔孔洞,加 速结构的失效,电迁移试验的微凸点截面的 SEM 图 片如图6 所示。
与微凸点的热电迁移相似,处理芯片与高带宽存 储芯片间的高密度布线亦存在上述问题,且处理芯片 工作时温度高达 100 ℃,其与存储芯片间的温度梯度 加速了上述现象的发生。在 FO 封装中,金属铜布线被 包裹在高分子钝化层中,使得其表面发生氧化、生成 氧化铜,铜布线的氧化失效如图 7 所示。在铜氧化的 过程中,铜不断向表面迁移,使得铜与氧化铜界面处 存在大量孔洞。在高温和大电流的作用下,上述氧化 现象更加明显,形成的大量孔洞严重影响布线强度与信号传输。一些研究采用非有机材料在铜表面形成保护层,将铜与高分子材料隔离,防止其氧化,由此导致 的新工艺增加了额外的制造成本。
5.3 封装体的散热问题
为追求最优的计算性能,处理芯片的技术节点不 断向前推进,集成的晶体管数量激增,与此同时,封装 的集成度进一步提高,要求封装体能够为处理芯片提 供热流密度高达 1 000 W/cm2的热量耗散能力。在高 端性能封装中,UHD FO、2.5D 和 3D 封装最终与基板贴合 , 一 般的组装 方 式 为 倒 装 芯 片 球 栅 阵 列 (FCBGA)。该封装的主要散热途径为背部热沉,一些 学者通过优化其设计,采用水冷、气液 2 相、风冷等方 式进行散热,优化结构的最大热耗散功率(Qmax)与有 效传热系数(heff)间的关系,以满足不同产品的应用需 求,热量耗散的主要途径如图 8 所示。
在 FCBGA 结构中,影响散热的另一重要因素为 热界面材料的选择。相比于传统的硅质材料,低熔点的金属材料更受到青睐,如铟、铟-银、锡和液态金属, 上述材料具有较大的导热系数,能够及时传递处理芯片工作时的热量。然而,基板焊球的回流焊会使这 些低熔点的材料再熔化,由此导致的孔洞与外溢问题 尚待有效解决。为进一步满足散热的需求,更加优质 的热界面材料有待开发,如石墨。除上述热沉和热界 面材料的选择外,有研究者也通过优化逻辑芯片与存 储芯片的叠层方式、FCBGA 的空腔大小等方式获得部分热性能的改进。
6 结束语
高性能计算、人工智能、云计算、数据中心和 5G 通信等领域的快速发展推动芯片技术向高性能、高带 宽的方向发展,由此导致单颗 SoC 的技术节点不断向 前推进,集成功能愈发复杂,制造成本不断攀升。一些 厂商将 SoC 的存储单元与处理单元分离出来,再经由 UHD FO、2.5D 和 3D 封装方式进行重新组合,以实现最优的计算性能。高端性能封装能够较好地满足处理 芯片日益增长的 I/O 密度、散热能力等的要求,有望得 到更多的关注和研究。
编辑:黄飞
评论
查看更多