通过采用英特尔 DPDK,并将 DPDK Vhost 的数据包拷贝操作从 CPU 卸载到英特尔 DSA,我们有效提升了云平台的网络性能,释放更多的 CPU 核心用于上层业务。结合 ZStack Cloud 在平台层面的底层创新,能够助力用户更高效处理海量数据,应对不断增长的业务压力,更好地 释放数据价值。
— 王为
ZStack 首席技术官
"挑战 ●如何提升云平台的网络服务能力,支撑大规模的数据传输与数据处理● 如何通过软件加速负载运行,降低 CPU 等硬件的占用率● 如何提升性能密度,降低总体拥有成本 (TCO)
概 述
作为云服务的重要基础资源,网络性能对于大规模数据的传输与处理有着重要意义。为了提升网络性能,云轴科技 ZStack 采用第四代英特尔 至强 可扩展处理器集成的英特尔 Data Streaming Accelerator(英特尔 DSA)加速器,以及英特尔 数据平面开发套件(英特尔 DPDK)进行加速,将网络性能提升了高达 1.117 倍1 。
解决方案
ZStack Cloud 云平台是遵循“简单、弹性、健壮、智能”的“4S”特性的私有云和无缝混合云产品。ZStack Cloud 产品已适配第四代英特尔 至强 可扩展处理器,可快速完成云平台整体部署。ZStack Cloud 基于高可用和分布式架构,面向中小型企业以及云计算服务提供商等多种用户,能够有效地帮助用户构建和维护稳定的多云环境,提高故障处理效率,降低运维成本。
图 1. ZStack Cloud 云平台架构图
为提升网络性能,ZStack Cloud 采用了第四代英特尔 至强 可扩展处理器进行加速。第四代英特尔 至强 可扩展处理器提供了出色性能和安全性,可根据用户的业务需求进行扩展。英特尔 数据流加速器(英特尔 DSA)是第四代英特尔 至强 可扩展处理器中的高性能数据移动和转换加速器,为数据移动提供了高带宽和低延时,可用于卸载 DPDK Vhost 中的数据包拷贝操作。
图 2. 由英特尔 DSA 赋能的物理机-虚拟机-物理机数据传输路径
在实际应用中,ZStack Cloud 在 DPDK Vhost 中将数据包拷贝操作从 CPU 卸载到英特尔 DSA,使得 Vhost 的处理内核可以避免进行繁重的数据包拷贝。
图 3. ZStack Cloud 将数据包拷贝操作卸载到英特尔 DSA
通过使用英特尔 DSA 加速器卸载 DPDK 下的数据包拷贝,ZStack Cloud 云平台在同节点通信下的网络带宽性能得到了 1.117 倍的性能提升,在跨节点通信场景下的网络带宽性能得到了 1.092 倍的性能提升2 。
图 4. OVS-DPDK 在启用英特尔 DSA 前后的吞吐性能对比(越高越好)3
测试结果表明,当数据包大小超过 256 字节时,英特尔 DSA 可以为 DPDK Vhost 带来显著的性能提升。当数据包大小超过 1K 字节时,英特尔 DSA 搬运数据的效率全面优于使用内核。在媒体流服务器和分布式数据处理服务器等应用场景中,英特尔 DSA 加速的 OVS-DPDK 均能够提供高效透明(虚拟机内应用无感知)的底层优化。
收 益 显著提升网络性能,加速虚拟机典型实例之间的数据移动,满足网络 密集型应用的需求,例如,其有助于降低流媒体业务的网络带宽抖动,在影视渲染场景中加快渲染节点和存储节点之间传输,在 AI 训练场景中实现云内网络进行高速互联; 将 ZStack Cloud 底层的数据包拷贝工作从 CPU 核心卸载到英特尔 DSA 模块,释放更多的 CPU 核心用于上层业务,有助于降低硬件投入,提升投资收益; 可有效利用英特尔 DSA,无需对上层业务进行定制改造,即可提供高带宽和低延时的网络服务; 通过开放式架构可以实现横向扩展,不受硬件型号限制,实现横向 扩容。
展 望
本次验证显示,英特尔 DSA 可在虚拟机实例数据移动等应用中,发挥出色的数据传输加速作用。ZStack 与英特尔将在此合作基础上,进一步探索利用第四代英特尔 至强 可扩展处理器的不同加速器加速负载运行,助力客户加快云平台变革。
参考资料:1 截止 ZStack 和英特尔 2023 年 7 月的测试结果。测试配置:双路英特尔 至强 金牌 6426Y 处理器,384 GB 总内存 (12*32 GB 4800 MHz),1*1.92 TB 固态盘,1*英特尔 以太网控制器 E810-XXV(25G 双端口),2*英特尔 以太网控制器 X710(10G 双 端口)。
2,3 截止 ZStack 和英特尔 2023 年 7 月的测试结果。测试配置:双路英特尔 至强 金牌 6426Y 处理器,384 GB 总内存 (12*32 GB 4800 MHz),1*1.92 TB 固态盘,1*英特尔 以太网控制器 E810-XXV (25G 双端口),2*英特尔 以太网控制器 X710(10G 双端口)。
实际性能受使用情况、配置和其他因素的差异影响。更多信息请见 www.Intel.com/PerformanceIndex
性能测试结果基于配置信息中显示的日期进行测试,且可能并未反映所有公开可用的安全更新。详情请参阅配置信息披露。没有任何产品或组件是绝对安全的。
具体成本和结果可能不同。
英特尔技术可能需要启用硬件、软件或激活服务。
英特尔未做出任何明示和默示的保证,包括但不限于,关于适销性、适合特定目的及不侵权的默示保证,以及在履约过程、交易过程或贸易惯例中引起的任何保证。
英特尔并不控制或审计第三方数据。请您审查该内容,咨询其他来源,并确认提及数据是否准确。
-
英特尔
+关注
关注
61文章
9941浏览量
171678 -
cpu
+关注
关注
68文章
10850浏览量
211517
原文标题:英特尔® DSA 助力云轴科技网络性能提升,海量数据传输游刃有余
文章出处:【微信号:英特尔中国,微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论