0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

双向4Tbps、兼容PCIe5.0!英特尔光学I/O chiplet再突破

Hobby观察 来源:电子发烧友 作者:梁浩斌 2024-07-05 09:04 次阅读

数据中心高速传输是提升目前算力的重要技术之一,光通信已经在数据中心内部服务器互联中广泛应用,而在更微观的角度,光互连还能够被应用到主板上CPUGPU的互连,甚至是更小尺度下的片上互连。

在2024年光纤通信大会(OFC)上,英特尔集成光子解决方案(IPS)部门展示了业界首款完全集成的光学计算互连(OCI)chiplet芯粒,该芯粒与英特尔CPU封装在一起,将过去通过铜线实现的电气I/O接口传输数据,变成采用光学I/O解决方案,实现了高带宽片上互连的突破。

AI数据中心,需要更高带宽的互连

随着“百模大战”的打响,目前市面上琳琅满目的AI大模型产品都需要大量的算力进行支撑,包括模型研发阶段的训练以及在实际落地中进行的推理计算都需要海量算力。随着AI模型变得越来越复杂,它们需要更多的计算资源和数据交换能力。高带宽互连可以提供必要的数据吞吐量,以支持这些大型模型的训练和推理。

而目前数据中心算力提升主要包括两部分,一是采用算力更高的计算卡,二是提高大规模数据中心服务器或CPU和GPU之间的带宽,提高整体系统的效率,比如英伟达的NVLink、AMD/英特尔/谷歌/微软等巨头共同组建的UALink标准等。

而从更加微观的角度来看,在算力芯片中,每个模块或者说每个Die、chiplet模块之间其实也需要进行互连。以往芯片上都采用传统的电互连,铜作为电传输信息的介质。但毕竟铜是有电阻的,在高速数据传输过程中,发热、损耗、功耗等都较高,相比之下,光传输损耗极低,且过程中不产生热量,非常适合解决数据传输瓶颈问题。

在AI计算中,尤其是深度学习算法通常需要大量的并行计算,更高带宽的互连能够让芯片上信息交换效率大大提升,从而实现更高效的并行处理。另外在chiplet封装的趋势下,多个模块封装在同一基板上集成为单颗SoC,更高速的片上互连则能加快这些芯粒之间的数据传输,从而提升计算能力。

从结构上看,片上光互连其实是一种光子集成芯片技术,将不同功能的有源器件和无源器件集成在同一块光电基板上。光电基板上具有光子路由波导,这些波导被用于数据通信,和用于电路走线的多层金属层。CMOS电芯片堆叠在硅光芯片上,在光电基板上形成二维阵列。

光从基板上的激光光源中发出,输入到基板上的路由波导,通过波导到达光芯片上的调制器。这个时候电芯片上的信息数据,通过电芯片和光芯片之间的微凸块加载到环形调制器中,将数字1和0转换为光的强度差异。

调制后的光信号通过光电基板上的波导传播,到达其他光芯片上的光电探测器中。这个时候光信号就被转换成电信号,这些信息就被不同的电芯片所接收。

当然在实际应用中,每个CMOS芯片和光芯片之间,都有数以千计的微凸块被用于数据传输。因为光信号传播不需要铜导线,损耗小,延迟低,这样就实现了在光电基板上进行高能效、高带宽密度、低延迟的光互连。

英特尔的集成OCI芯粒有哪些亮点?

据英特尔介绍,在OFC上展示的OCI芯粒集成了硅光子集成电路,包括片上激光器和光放大器、与电子集成电路。OCI芯粒除了在现场展示的与英特尔CPU封装在一起外,还可以与下一代的CPU、GPU、IPUs以及其他SoC集成。

英特尔OCI支持高达4Tbps的双向数据传输速率,与第五代PCIe兼容。在OFC现场光学链路演示展示了两个CPU平台之间通过单模光纤(SMF)跳线连接的发射机(Tx)和接收机(Rx)。CPU生成并测量了光比特错误率(BER),演示展示了在单根光纤上8个波长、200GHz间隔的Tx光谱,以及一个32Gbps的Tx眼图,展示了强大的信号质量。

目前的OCI芯粒支持每个方向上64个通道的32Gbps数据传输,传输距离可达100米(尽管由于飞行时间延迟,实际应用可能限制在几十米以内),使用八对光纤,每对携带八个密集波分复用(DWDM)波长。共封装解决方案的能效也非常高,每比特仅消耗5pJ,相比之下,可插拔光收发模块大约为15pJ/bit。这种超高效能水平对于数据中心和高性能计算环境至关重要,并且可能有助于解决人工智能不可持续的功率需求问题。

作为在硅光领域投入多年的半导体巨头,英特尔的主要优势就是高度集成化,采用混合激光器晶圆上技术和直接集成,这带来更高的可靠性和更低的成本。这种独特的方法使英特尔能够在保持效率的同时提供卓越的性能。英特尔强大、高容量的平台已经出货超过800万个光子集成电路(PICs),集成了超过3200万个芯片级激光器,显示出时间失效(FIT)率低于0.1,可靠性极高。

小结:

除了英特尔之外,目前在片上光互连领域还有曦智科技、Ayar Labs等企业在投入研发,并取得了一定成果。2023年Hot CHIPS会议上,曦智科技展示了其片上光互连技术上的最新进展,该系统的通道数为512,单通道最长广播距离为50mm,广播延时1ns,单通道频率4GHz,片上总带宽达到2Tbps。可以预见,随着数据中心算力需求的提高,片上光互连将会加快落地的进程。



声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9608

    浏览量

    169994
  • chiplet
    +关注

    关注

    6

    文章

    386

    浏览量

    12466
  • PCIe5.0
    +关注

    关注

    0

    文章

    15

    浏览量

    1155
收藏 人收藏

    评论

    相关推荐

    英特尔OCI芯粒在新兴AI基础设施中实现光学I/O(输入/输出)共封装

    (IPS)团队展示了业界领先的、完全集成的OCI(光学计算互连)芯粒,该芯粒与英特尔CPU封装在一起,运行真实数据。面向数据中心和HPC应用,英特尔打造的OCI芯粒在新兴AI基础设施中实现了
    的头像 发表于 06-29 11:47 427次阅读

    英特尔实现光学I/O芯粒的完全集成

    在科技日新月异的今天,数据传输速度的提升已成为推动各行业发展的关键因素。近日,英特尔在高速数据传输的硅光集成技术上取得了令人瞩目的突破,为数据中心和HPC(高性能计算)应用带来了革命性的变化。
    的头像 发表于 06-29 09:27 296次阅读

    英特尔推出集成光学计算互联OCI Chiplet芯片

    在全球信息技术飞速发展的今天,数据传输速度和效率成为了决定科技竞争力的关键因素之一。英特尔,作为全球领先的半导体公司,始终站在技术革新的前沿。近日,英特尔宣布了一项具有划时代意义的里程碑成果——集成光学计算互联(OCI)
    的头像 发表于 06-28 10:55 330次阅读

    英特尔实现光学IO芯粒的完全集成

    (IPS)团队展示了业界领先的、完全集成的OCI(光学计算互连)芯粒,该芯粒与英特尔CPU封装在一起,运行真实数据。面向数据中心和HPC应用,英特尔打造的OCI芯粒在新兴AI基础设施中实现了
    的头像 发表于 06-28 10:16 133次阅读
    <b class='flag-5'>英特尔</b>实现<b class='flag-5'>光学</b>IO芯粒的完全集成

    AlmaLinux 9.4兼容弃用的RHEL硬件,包括英特尔Data Streaming设备

    AlmaLinux 9.4效仿 RHEL 9.4增强多项功能/特性,例如全力兼容英特尔Data Streaming Accelerator驱动及英特尔SGX,同时以技术预览方式支持NVMe over TCP,并为用户提供Pyth
    的头像 发表于 05-07 10:57 514次阅读

    BittWare提供基于英特尔Agilex™ 7 FPGA最新加速板

    BittWare 当前的加速板产品组合包括最新的英特尔 Agilex 7 FPGA F、I 和 M 系列,包括 Compute Express Link (CXL) 和 PCIe* 5.0
    的头像 发表于 04-30 15:22 589次阅读
    BittWare提供基于<b class='flag-5'>英特尔</b>Agilex™ 7 FPGA最新加速板

    英特尔Clearwater Forest系列突破高核心数服务器CPU

    在封装方面,英特尔表示,对于Clearwater Forest,将使用其他工艺节点来实现SRAM和I/O,因为这些节点在较新的工艺上无法很好地扩展。
    发表于 03-01 14:30 245次阅读

    什么是PCIePCIe有什么用途?PCIe 5.0有何不同?

    随着英特尔Alder Lake CPU的发布,以及AMD 7000 Ryzen CPU的即将发布,PCIe 5.0 硬件终于成为现实。但什么是 PCIe
    的头像 发表于 11-18 16:48 2293次阅读
    什么是<b class='flag-5'>PCIe</b>?<b class='flag-5'>PCIe</b>有什么用途?<b class='flag-5'>PCIe</b> <b class='flag-5'>5.0</b>有何不同?

    #高通 #英特尔 #Elite 高通X Elite芯片或终结苹果、英特尔的芯片王朝

    高通英特尔苹果
    深圳市浮思特科技有限公司
    发布于 :2023年10月27日 16:46:07

    英特尔发布面向发烧友的英特尔酷睿第14代台式机处理器

    ,由于比前一代增加了4个能效核,i7-14700K拥有20核心和28线程。英特尔Extreme Tuning Utility新增了AI Assist功能,为特定的未锁频台式机处理器带来AI引导的一键超频功能 1 。 “ 自推出高
    的头像 发表于 10-21 16:40 579次阅读

    新思科技成功实现与英特尔PCIe 6.0测试芯片的互操作性

    新思科技PCIe 6.0 IP与英特尔 PCIe 6.0测试芯片实现互操作 在64GT/s 高速连接下成功验证互操作性,降低高性能计算SoC的集成风险 新思科技近日宣布,新思科技PCI
    的头像 发表于 10-16 09:22 591次阅读

    新思科技PCIe 6.0 IP与英特尔PCIe 6.0测试芯片实现互操作

    :SNPS)近日宣布,新思科技PCI Express(PCIe)6.0 IP在端到端64GT/s的连接下,成功实现与英特尔PCIe 6.0测试芯片的互操作性。这一全新里程碑也将保证,在未来无论是集成
    发表于 10-12 15:11 218次阅读

    台积电、英特尔携手推出全球首款小芯片互联

    技)UCIe IP的两个小芯片,透过英特尔EMIB先进封装进行连接。 随着科技不断进步,芯片技术日新月异,英特尔在创新日上向全球展示了一项令人瞩目的突破。这项突破是世界上第一个采用UC
    的头像 发表于 09-22 18:17 534次阅读

    英特尔发布全球首款基于UCIe连接的Chiplet(小芯片)处理器

    英特尔基于Chiplet的处理器,如Sapphire Rapids和新发布的Meteor Lake,目前使用专有接口和协议进行Chiplet之间的通信,但英特尔已宣布将在其下一代Arr
    发表于 09-22 16:05 499次阅读
    <b class='flag-5'>英特尔</b>发布全球首款基于UCIe连接的<b class='flag-5'>Chiplet</b>(小芯片)处理器

    Chiplet使英特尔PSG能够为其FPGA添加许多新功能

    Chiplet 使英特尔 PSG 能够为其 FPGA 添加许多新功能
    的头像 发表于 08-24 16:18 801次阅读