电子发烧友网报道(文/周凯扬)随着AI与HPC运算的盛行,如今为了将算力继续扩展下去,CPU和GPU都在朝着多核的方向发展下去,计算密度也在大幅提升。此外,数据中心也越来越多地开始转向异构工作负载,对基础架构、性能和可用性提出了又一轮的要求,也在加速存储产品的转型,催生了CXL这样的新技术,但仅仅只靠CXL,是无法打破我们所说的内存瓶颈的。
加速内部流量成为服务器性能的新关键
100GbE模块的出现后,在网络交换与传输性能如此发达的当下,远程存储已经成了越来越多企业的首选。但本地存储也在经历一轮性能的革命,NVMe、NVDIMM等技术演进进一步降低了存储的网络延迟,解决了一路走高的内部带宽需求。
那么服务器内部数据的移动要如何跟上呢?在复杂的服务器基础架构中,内部数据的交换往往由多个内存缓冲拷贝组成,比如内核到I/O、I/O到特定硬件,实现方式主要靠不同层级的软件栈,但软件到软件间的数据交换仍靠的是CPU。
当下的内存数据移动的软件标准为memcpu,虽然已经足够稳定,但也限制了应用的性能。比如为了提供上下文隔离而招致更大的软件开销。所以大家开始尝试DMA,这种用于卸载软件复制循环的策略。虽说这样做解放了CPU的部分负担,但这种方案与特定设备的接口绑定,只适合专门的特权软件和I/O用例,更别提前向兼容了,尤其是在公有云这种多人功用的虚拟环境中。
SDXI,新的数据加速器接口标准
这就引出了一系列痛点,比如既要从CPU执行周期中将I/O解放出来,又要保证架构的稳定性。提供虚拟机加速的同时,又能帮助开发者从已有软件栈中迁移到新的方案上,还要考虑到当下新的内存互联方案,比如CXL、Gen-Z等等。为了解决这些痛点,2020年起,SNIA(全球网络存储工业协会)成立了一个新的工作组并提出了SDXI(智能数据加速器接口)这一概念,为的就是提供一个可扩展、虚拟化且前向兼容的内存数据移动与加速接口规范。
SDXI下的内存间数据移动 / SNIA
SDXI作为一个标准化方案,不仅要兼容DRAM、SCM、MMIO、CXL和Gen-Z这些不同的内存,也要为CPU、GPU、FPGA、智能I/O等提供标准的加速器接口。如此一来,SDXI可以在不同的地址空间实现数据移动,包括用户地址空间和不同的虚拟机等。而且一旦连接建立,数据移动再也不需要特权软件作为中介。从戴尔在PCIe 3.0 FPGA上的原型测试上来安,改用SDXI可以实现超过memcpy两倍以上的线性拷贝速度。
截至目前,不少内存厂商和服务器厂商都已经加入了对SDXI的贡献行列中来,比如AMD、Arm、戴尔、HPE、IBM,以及美光、三星、SK海力士等。他们也在考虑在1.0标准之后,继续从QoS、延迟、RAS上加以改进,在实现未来版本前向与后向兼容的同时,一起推动SDXI在CXL系统架构中的普及。
小结
在ARM、RISC-V纷纷入局数据中心,并推出百核、千核的CPU处理器后,更快的数据交换将成为一个必然的需求,未来的网络与存储技术也需要SDXI提供这样的扩展性。何况SDXI提供的不仅仅是加速,还是一个标准化接口,在满足数据移动性能的同时,支持软件爱你的重复利用和虚拟化。
加速内部流量成为服务器性能的新关键
100GbE模块的出现后,在网络交换与传输性能如此发达的当下,远程存储已经成了越来越多企业的首选。但本地存储也在经历一轮性能的革命,NVMe、NVDIMM等技术演进进一步降低了存储的网络延迟,解决了一路走高的内部带宽需求。
那么服务器内部数据的移动要如何跟上呢?在复杂的服务器基础架构中,内部数据的交换往往由多个内存缓冲拷贝组成,比如内核到I/O、I/O到特定硬件,实现方式主要靠不同层级的软件栈,但软件到软件间的数据交换仍靠的是CPU。
当下的内存数据移动的软件标准为memcpu,虽然已经足够稳定,但也限制了应用的性能。比如为了提供上下文隔离而招致更大的软件开销。所以大家开始尝试DMA,这种用于卸载软件复制循环的策略。虽说这样做解放了CPU的部分负担,但这种方案与特定设备的接口绑定,只适合专门的特权软件和I/O用例,更别提前向兼容了,尤其是在公有云这种多人功用的虚拟环境中。
SDXI,新的数据加速器接口标准
这就引出了一系列痛点,比如既要从CPU执行周期中将I/O解放出来,又要保证架构的稳定性。提供虚拟机加速的同时,又能帮助开发者从已有软件栈中迁移到新的方案上,还要考虑到当下新的内存互联方案,比如CXL、Gen-Z等等。为了解决这些痛点,2020年起,SNIA(全球网络存储工业协会)成立了一个新的工作组并提出了SDXI(智能数据加速器接口)这一概念,为的就是提供一个可扩展、虚拟化且前向兼容的内存数据移动与加速接口规范。
SDXI下的内存间数据移动 / SNIA
截至目前,不少内存厂商和服务器厂商都已经加入了对SDXI的贡献行列中来,比如AMD、Arm、戴尔、HPE、IBM,以及美光、三星、SK海力士等。他们也在考虑在1.0标准之后,继续从QoS、延迟、RAS上加以改进,在实现未来版本前向与后向兼容的同时,一起推动SDXI在CXL系统架构中的普及。
小结
在ARM、RISC-V纷纷入局数据中心,并推出百核、千核的CPU处理器后,更快的数据交换将成为一个必然的需求,未来的网络与存储技术也需要SDXI提供这样的扩展性。何况SDXI提供的不仅仅是加速,还是一个标准化接口,在满足数据移动性能的同时,支持软件爱你的重复利用和虚拟化。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
发布评论请先 登录
相关推荐
内存扩展CXL加速发展,繁荣AI存储
电子发烧友网报道(文/黄晶晶)CXL即Compute Express Link,是一种全新的互连协议,为各种处理器包括CPU、GPU、FPGA、加速器和存储设备提供统一接口标准,可以有
研华科技推出SQRAM CXL 2.0 Type 3内存模块SQR-CX5N
10月15日最新消息,研华科技(Advantech)于昨日正式揭晓了其最新研发的SQRAM CXL 2.0 Type 3 内存模块——SQR-CX5N。该模块遵循EDSFF E3.S 2T标准,拥有
ALVA AR技术助力数字化展示升级
随着科技的发展,技术产品更新换代的速度日益加快。要在激烈的市场竞争中脱颖而出,企业只靠技术实力还不够,有效的营销展示方式也成为重要抓手。
新思科技CXL 3.1验证解决方案
、内存缓冲区、智能网络接口卡、持久存储器和固态驱动器等设备之间的开放式行业标准互连接口。CXL基于PCIe灵活的数据带宽提供了缓存一致性和存储语义,同时实现比PCIe低得多的延时。
bluenrg缓存不够报错怎么解决?
有没有人用过st的蓝牙芯片啊?感觉太不好了,FAE也不给力,蓝牙与手机连接后会断开,数据在上传时因为ble buffer缓存不够也会报错,然后断开连接,问FAE为什么修改连接间隔第
发表于 05-13 09:02
三星研发CXL混合存储模组,实现闪存与CPU数据直传
据三星展示的图片显示,此模组可以通过CXL接口在闪存部分及CPU之间进行I/O块传输,也可以运用DRAM缓存和CXL接口达到64字节的内存I/O传输。
利用CXL技术重构基于RDMA的内存解耦合
本文提出了一种基于RDMA和CXL的新型低延迟、高可扩展性的内存解耦合系统Rcmp。其显著特点是通过CXL提高了基于RDMA系统的性能,并利用RDMA克服了CXL的距离限制。
发表于 02-29 10:05
•2381次阅读
小米22.5W移动电源靠谱吗?
小米22.5W移动电源靠谱吗? 小米22.5W移动电源是小米生态链公司推出的一款高容量、高功率的移动电源产品,其标称容量为22.5W,实际容
什么是CXL技术?CXL的三种模式、类型、应用
CXL的目标:解决CPU和设备、设备和设备之间的内存鸿沟。服务器有巨大的内存池和数量庞大的基于PCIe运算加速器,每个上面都有很大的内存。内存的分割已经造成巨大的浪费、不便和性能下降。CXL就是为解决这个问题而诞生。
三星电子携手红帽成功实现CXL内存扩展平台全方位运行测试
近日,三星电子联合红帽(Red Hat)共同完成重大技术里程碑——在实际用户环境中全面验证CXL( Compute Express Link )内存扩展平台的运作。此次成功标志着三星CXL生态系统的进一步扩张,
三星携手红帽在真实用户环境下验证CXL内存技术
CXL凭借其统一的接口标准,通过PCIe接口连接各类处理器如CPU、GPU及内存设备,有效解决了当前系统在速度、延迟和可扩展性上所面临的瓶颈。
USB-C为何还不能统一所有接口?
USB-C为何还不能统一所有接口? USB-C(全称为USB Type-C)是一种通用连接标准,被广泛运用于各类设备中,包括电脑、平板、手机和配件等。相较于早期的USB接口,USB-C
关于CXL的功能与特性详解
CXL.io 和CXL.cache 是CXL 协定中的两个子协定,它们的功能和用途有所不同,主要是为了引入非对称的概念;CXL.io 类似于PCIe 的事件(event),主要用于初始
评论