0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CXL是什么?为什么它是各种应用程序的游戏规则改变者?

半导体产业纵横 来源:半导体产业纵横 2023-06-25 10:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

高带宽互连彻底改变了以数据为中心的计算。

CXL(Compute Express Link)可以提高数据中心内存的性能、可扩展性和灵活性。MemVerge 的 Steve Scargall 解释了 CXL 是什么、它是如何工作的,以及为什么它是各种应用程序的游戏规则改变者,例如 AI/ML、HPC、数据库和分析。他还强调了采用 CXL 标准化的云计算和数据中心基础设施的一些行业趋势。

CXL是一种新兴的开放式行业标准互连,彻底改变了以数据为中心的计算。凭借其在 CPU 和设备(例如加速器、内存扩展和持久内存设备)之间的高带宽和低延迟缓存一致性连接,CXL 有可能重塑数据中心内存的性能、可扩展性和灵活性。通过解决 AI/ML 应用程序面临的常见内存挑战并启用新的高性能内存架构,CXL 有望成为以数据为中心的计算的下一代互连。

什么是 CXL?

CXL 是一种行业采用的开放标准,为处理器、内存扩展和加速器提供高速缓存一致性互连。它基于 PCI Express (PCIe) 规范物理和电气接口,但为 AI/ML 应用程序提供了额外的功能和优势。CXL 可实现 CPU 内存空间与附加设备(例如加速器、GPU 或内存设备)上的内存之间的内存一致性。这意味着 CPU 和设备可以共享相同的内存视图并访问它,而无需任何软件干预或同步。CXL 还通过允许 CPU 以低延迟和高带宽访问连接设备上更大的内存池来扩展内存。这可以增加 AI/ML 应用程序的内存容量和性能。

规范的三个主要版本描述了 CXL 标准。未来计划更多主要版本。现有主要版本的更新也将根据需要公布。每个主要版本都为以前的版本添加了新功能。

CXL 1.0:CXL 的第一个版本,于 2019 年 3 月发布,基于 PCIe 5.0。它允许主机 CPU 使用缓存一致性协议 (CXL.cache) 访问加速器设备上的共享内存,并使用内存语义 (CXL.mem) 启用内存扩展。

CXL 2.0:CXL 的第二个版本,于 2020 年 11 月发布,基于 PCIe 5.0。它支持 CXL 交换,将多个 CXL 设备连接到一个主机处理器或将每个设备连接到多个主机处理器。它还实现了设备完整性和数据加密功能。

CXL 3.0:CXL 的第三个版本,于 2022 年 8 月发布,基于 PCIe 6.0。它支持比 CXL 2.0 更高的带宽和更低的延迟,并增加了设备热插拔、电源管理和错误处理等新功能。

图 1 显示了每个主要 CXL 版本的功能比较。

37732ed2-11a8-11ee-962d-dac502259ad0.png图 1:CXL 功能比较

CXL 规范描述了三种允许设备相互通信的协议。

CXL.io:PCIe 5.0 协议的增强版本,可用于初始化、链接、设备发现、枚举和寄存器访问。它为 I/O 设备提供非一致性加载/存储接口。

CXL.cache :一种缓存一致性协议,它定义了主机和设备之间的交互,允许连接的 CXL 设备使用请求和响应方法以极低的延迟有效地缓存主机内存。

CXL.mem :一种内存协议,它使用加载和存储命令为主机处理器提供对连接设备内存的访问,其中主机 CPU 充当主设备,CXL 设备充当从属设备。它可以支持易失性和持久性内存架构。

至少,所有 CXL 设备都必须使用 CXL.io,但可以选择支持 CXL.cache 或 CXL.mem,或同时支持两者。 这些组合派生出三种设备类型:

类型 1 :没有本地内存的专用加速器(例如智能 NIC)。设备依赖于使用 CXL.io 和 CXL.cache 协议对主机 CPU 内存进行一致访问。它们可以扩展 PCIe 协议功能(例如原子操作),并且可能需要实现自定义排序模型。

类型 2 :具有高性能本地内存(GDDR 或 HBM)的通用加速器(GPU、ASICFPGA)。要访问主机 CPU 和设备内存,设备可以使用 CXL.io、CXL.cache 和 CXL.mem 协议。它们可以支持连贯和非连贯事务。

类型 3 :没有本地缓存的内存扩展板和持久内存设备。设备可以使用 CXL.io 和 CXL.mem 协议通过加载和存储命令为主机 CPU 提供对内存的访问。它们可以支持易失性和持久性内存架构。

基础设施用例

CXL 是云和本地数据中心基础设施的游戏规则改变者,预计将很快得到广泛采用和标准化,包括:

1.云计算

CXL 可以使云服务提供商通过利用支持 CXL 的设备(例如加速器、内存扩展设备和持久性内存设备)为其客户提供更快、更高效的服务。云服务提供商每年在未使用或未充分利用的主内存(称为“搁浅内存”)上花费数十亿美元。应用程序可以更优化地使用集群中的计算节点按需访问的 CXL 设备池,从而优化数据中心资源。

2.数据中心存储

与云环境类似,虽然规模小得多,但 CXL 设备可以使数据中心运营商构建可持续发展的环境,并通过使用支持 CXL 的设备显著降低其基础设施成本和使用率。CXL 可以通过启用对内存驻留数据的低延迟和高带宽访问来提高块存储性能和可靠性。

3. 边缘计算

CXL 可以使边缘计算平台通过使用支持 CXL 的设备(例如加速器、智能 NIC、内存扩展设备和持久内存设备)来处理不断增加的数据量和复杂性。在将数据发送到主数据中心之前在边缘处理数据可以减少流量并提高边缘计算性能、效率和安全性。

4. 网络

CXL 可以使网络平台通过使用支持 CXL 的网络设备(例如智能 NIC、FPGA 和 ASIC)来处理不断增加的网络流量和复杂性。CXL 可以通过实现对设备内存的一致和非一致访问以及支持原子操作和自定义排序模型来提高网络性能、可扩展性和功能。

应用用例

应用程序将从支持 CXL 的基础架构中受益匪浅。一些主要的兴趣领域包括:

1.AI/ML加速

CXL 可以为 GPU、ASIC 或 FPGA 等 AI/ML 加速器实现更快、更高效的 CPU 到设备和 CPU 到内存的连接。CXL 可以支持异构设备之间的一致性和非一致性事务、内存扩展和资源共享。允许应用程序处理更大的数据集,同时减少主机之间传输的数据量,从而缩短获得结果的时间。

2.大规模内存、分析和图形数据库

CXL 允许数据库访问无限的低延迟和高带宽内存,从而使系统能够在更大的数据池上工作。

3.高性能计算

CXL 可以通过利用支持 CXL 的加速器和内存池来提高高性能计算的性能、可扩展性和灵活性。CXL 3.0 引入了共享内存功能,允许许多计算节点就地访问内存驻留数据,而无需在运行前将其复制到本地,然后再将结果复制回来。

使用 CXL 的行业标准互连加速以数据为中心的计算

CXL 是一种新兴的开放式行业标准互连,可在 CPU 和设备(如加速器、内存扩展和持久内存设备)之间提供高带宽和低延迟缓存一致性连接。CXL 可以提高数据中心资源的性能、可扩展性和灵活性。CXL 可以帮助解决 AI/ML 应用程序面临的一些常见内存挑战,例如内存不足错误、溢出到磁盘以及数据/计算偏差。

CXL 还可以支持需要大规模和高性能内存架构的新应用程序和用例,例如内存数据库、实时分析和高性能计算。由英特尔AMDArm、Astera Labs、三星、美光、X-Conn 等众多行业领导者和创新者组成的不断壮大的生态系统支持 CXL。作为以数据为中心的计算的下一代互连,CXL 有望在不久的将来得到广泛接受和标准化。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20332

    浏览量

    254885
  • 电源管理
    +关注

    关注

    117

    文章

    8566

    浏览量

    148242
  • 加速器
    +关注

    关注

    2

    文章

    841

    浏览量

    40239
  • PCIe接口
    +关注

    关注

    0

    文章

    128

    浏览量

    10653

原文标题:CXL是什么?它是如何工作的?

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    从替代到必需:氮化镓正在重写电源系统的“游戏规则

    如果你留意过这两年手机充电器的变化,会发现它们越来越小、越来越轻,但充电速度却越来越快。背后的“功臣”,就是氮化镓。这项曾被视作硅的“备胎”的材料,如今正悄悄改变从快充到服务器、从电动汽车到工业设备
    的头像 发表于 04-20 14:36 705次阅读
    从替代到必需:氮化镓正在重写电源系统的“<b class='flag-5'>游戏规则</b>”

    量子计算即将彻底改变AR和VR游戏领域

    开发可以引入量子计算,以改进游戏机制,通过增强现实 (AR) 和虚拟现实 (VR) 技术提供更沉浸式的体验,并拓展游戏中艺术与音乐的边界。
    的头像 发表于 04-17 10:19 444次阅读

    RDMA设计56:如何设计基于RDMA的应用程序

    本博文主要交流设计思路,在本博客已给出相关博文约140篇,希望对初学者有用。 注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP 设计。 应用程序的工作流程如图 1所示,大致分为 READ 包
    发表于 04-05 09:54

    如何构建蓝牙应用程序

    应用程序使用蓝牙(blueZ)。 我已经安装了 gcc-riscv64-linux-gnu。 但是,没有安装 blueZ 标头和库。 如何构建我的蓝牙应用程序
    发表于 04-01 07:31

    新型HERB技术如何重塑芯片蚀刻工艺

    在芯片制造的精密世界中,蚀刻工艺是决定电路精度和性能的关键步骤。近年来,离子传输技术的突破正在悄然改变这一领域的游戏规则。本文将通过对比传统正弦波技术与新型HERB技术,解析蚀刻工艺的演进及其对半导体产业的影响。
    的头像 发表于 03-24 16:50 186次阅读
    新型HERB技术如何重塑芯片蚀刻工艺

    Penguin Solutions SMART Modular CXL NV-CMM E3.S 2T 内存模块通过 CXL 兼容性认证

    高性能计算与 AI 基础架构解决方案领导厂商 Penguin Solutions, Inc.(Nasdaq: PENG)宣布其 SMART Modular CXL NV-CMM E3.S 2T 非易
    的头像 发表于 01-15 15:35 1186次阅读

    在Termux环境下实现康威生命游戏

    你想要在Termux环境下实现康威生命游戏,并专门展示经典的“滑翔机”模式,构建一个能持续运行的二维世界,同时需要完整的程序代码和调试说明。 一、实现思路康威生命游戏的核心是遵循4条规则
    发表于 12-21 18:36

    借助CXL和压缩技术实现高效数据传输

    AI、科学计算、海量内存处理……这些硬核工作负载正在不断挑战系统极限。而 FPGA 异军突起,成为了实现高效数据传输的“关键推手”。想知道怎么在不改变整体架构的前提下,让带宽和能效实现“双飞跃”?答案就藏在压缩 IP 与基于 CXL(Compute Express Lin
    的头像 发表于 12-19 09:43 523次阅读
    借助<b class='flag-5'>CXL</b>和压缩技术实现高效数据传输

    过采样技术如何提高ADC的动态性能

    你是否也遇到过分辨率不足、噪声过高的问题?在高速、高精度的信号采集场景中,ADC的动态性能往往成为系统瓶颈。其实,解决方案可能比你想象的简单——过采样技术,正在悄悄改变游戏规则
    的头像 发表于 12-03 10:27 5588次阅读
    过采样技术如何提高ADC的动态性能

    PYQT 应用程序框架及开发工具

    特点,已成为嵌入式领域的重要开发工具 PyQt 是一个创建 GUI 应用程序的工具包。它是 Python 编程语言和 Qt 库的成功融合。因为可用的类有很多,他们被分成几个模块。QtCore 模块
    发表于 10-29 07:15

    焊锡是一种新型材料 与SMT应用程序一起生产 它是由锡粉和助焊剂组成的 #锡膏 #焊锡膏 #锡膏品牌

    应用程序
    深圳市佳金源工业科技有限公司
    发布于 :2025年10月24日 17:44:41

    正方科技千乘动力智慧储能解决方案赋能多元场景

    当我们谈论能源的未来时,储能技术正成为改变游戏规则的关键力量。它不仅仅是能量的容器,更是能源管理的智慧大脑,让电力在时间与空间上实现更高效的分配与利用。
    的头像 发表于 09-16 16:33 1207次阅读

    学生适合使用的SOLIDWORKS 云应用程序

    随着科技的不断发展,计算机辅助设计(CAD)技术已经成为现代工程教育的重要组成部分。SOLIDWORKS作为一款CAD软件,其教育版云应用程序为学生提供了强大而灵活的设计平台。本文将探讨
    的头像 发表于 09-15 10:39 940次阅读
    学生适合使用的SOLIDWORKS 云<b class='flag-5'>应用程序</b>

    Prometheus超低亮高精度色度计- HDR显示计量领域的游戏规则改变!

    什么是HDR?高动态范围(High-DynamicRange,简称HDR)作为超高清音视频产业的关键技术之一,拥有更广的色彩容积和更高的动态范围,为图像保留更多细节。通过丰富的图像亮部和暗部细节,在对比度、灰度等维度上提升影像质量,让用户眼中的影像更加细腻真实,更富有感染力。在HDR技术中,动态范围指的就是图像的最大亮度和最小亮度的比值。对比度有几种不同的计
    的头像 发表于 06-04 11:12 1568次阅读
    Prometheus超低亮高精度色度计- HDR显示计量领域的<b class='flag-5'>游戏规则</b><b class='flag-5'>改变</b><b class='flag-5'>者</b>!

    第二代AMD Versal Premium系列SoC满足各种CXL应用需求

    第二代 AMD Versal Premium 系列自适应 SoC 是一款多功能且可配置的平台,提供全面的 CXL 3.1 子系统。该系列自适应 SoC 旨在满足从简单到复杂的各种 CXL 应用需求
    的头像 发表于 04-24 14:52 1409次阅读
    第二代AMD Versal Premium系列SoC满足<b class='flag-5'>各种</b><b class='flag-5'>CXL</b>应用需求