详解DPU存储、安全卸载及架构-电子发烧友网

上一期分享了“详解DPU网络卸载场景及架构”，今天接着DPU话题，继续聊聊DPU另外的两大应用场景。

DPU数据平面需要一种大规模敏捷异构的计算架构。这一部分的实现也处在“百家争鸣”的阶段，各家的实现方式差别较大，有基于通用处理器核的方式，有基于可编程门阵列FPGA的方式，也有基于异构众核的方式，还有待探索。

存储功能卸载NVMe-oF硬件加速

NVMe over Fabric（又名NVMe-oF）是一个相对较新的协议规范，旨在使用NVMe通过网络结构将主机连接到存储，支持对数据中心的计算和存储进行分解。NVMe-oF协议定义了使用各种通用的传输协议来实现NVMe功能的方式。在NVMe-oF诞生之前，数据存储协议可以分为三种：

（1）iSCSI：是一种基于IP的存储网络标准，在TCP/IP网络上通过发送 SCSI命令来访问块存储服务。

（2）光纤通道（Fibre Channel）：是一种高速的数据传输协议，提供有序无损的块数据传输。主要用于关键高可靠要求的业务上。

（3）SAS（Serial Attached SCSI）：一种点对点串行协议，通过SAS线缆传输数据。

上述数据存储协议，在当今数据爆发的时代，已经无法满足大数据量的传输。NVMe-oF的出现，不仅解决了上述协议的性能瓶颈问题，它还允许组织为高度分布式、高度可用的应用程序实施横向扩展的存储。通过将NVMe协议扩展到SAN设备，NVMe-oF提高了CPU的使用效率，同时提高了服务器和存储应用程序之间的连接速度。

NVMe-oF主要支持三大类Fabric传输选项，分别是FC、RDMA和TCP，其中RDMA支持InfiniBand、RoCEv2和iWARP。

NVMe-oF/FC和第六代FC可以共存于同一基础设施中，避免了数据中心的叉车升级。但是，NVMe-oF/FC不具有软件定义存储的能力。NVMe-oF/RDMA利用了RDMA网络的优势，是理想的Fabric，提供了低延迟、低抖动和低CPU使用率低传输层协议，可以最大限度利用硬件加速，避免软件协议栈开销。同时，由于RDMA是一种内存读写技术，可以应用在众多场景中，如GPUDirect Storage的应用场景。

NVMe-oF/TCP利用了TCP协议的可靠性传输的特点，以及TCP/IP网络的通用性和良好的互操作性，可以完美的应用于现代数据中心网络。在相对性能要求不是非常高的场景，NVMe-oF/TCP可作为备选。

NVMe支持Host端（Initiator或Client）和Controller端（Target或Server），目前DPU智能网卡硬件加速的场景中，包括如下四中情况：

（1）普通智能网卡硬件加速NVMe-oF Initiator。智能网卡支持NVMe-oF/TCP和NVMe-oF/RoCEv2作为Initiator，通过硬件卸载NVMe-oF/TCP或NVMe- oF/RoCEv2，用于计算和存储之间，来达到较高性能。

（2）支持GPUDirect Storage的智能网卡加速NVMe-oF Initiator和Target。GPUDirect Storage是NVIDIA提出的GPU可以绕过CPU直接访问存储磁盘的技术，RDMA技术是GPUDirect Storage的基础。这类网卡可以通过硬件卸载NVMe- oF/RDMA来实现GPU与远端存储服务的直接访问。常见的如NVMe-oF/RDMA IB和NVMe-oF/RoCEv2。

（3）智能网卡硬件加速NVMe-oF Target。该场景主要是通过智能网卡提供PCIe Root Complex能力和NVMe-oF Controller端的硬件卸载加速，来实现NVMe存储服务器。如Broadcom Stingray PS1100R是这个场景的代表之一。

（4）DPU芯片硬件加速NVMe-oF Target。该场景是通过DPU芯片提供多个PCIe Root Complex通道以及多个100Gbps的网卡实现的超大吞吐的存储服务器。Fungible FS1600 12x100Gbps带宽吞吐的存储服务器是这个场景的典型代表。

OpenStack从Rocky版本已经支持了NVMe-oF，通过OpenStack Cinder通过消息在NVMe-oF Target上来创建，查询和删除卷等，OpenStack Nova在主机上通过NVMe-oF Initiator发现NVMe-oF存储设备，并将存储设备信息传递给Hypervisor来实现虚拟机挂载磁盘。另外，OpenStack集成Ceph做块存储和对象存储已经非常成熟，Ceph的后端存储也渐渐的从使用本地磁盘的方式转向远端NVMe存储，这样NVMe-oF为Ceph存储服务提供了容量可伸缩的能力。

Virtio-blk硬件加速基于virtio的virtio-blk是KVM-Qemu虚拟化生态中的虚拟化块存储的一种实现方式，利用了virtio共享内存的机制，提供了一种高效的块存储挂载的方法。Guest OS内核通过加载virtio-blk驱动，实现块存储的读写，无需额外的厂家专用驱动。Virtio-blk设备在虚拟机以一个磁盘的方式呈现，是目前应用最广泛的虚拟存储控制器。

由于virtio机制通过硬件实现加速已经是通用做法，所以利用这个优势，virtio-blk卸载到硬件，已经是必然趋势。在智能网卡中，将virtio-blk到后端映射到如NVMe-oF的远端磁盘上，这样相比较当前virtio-blk的用法，不需要在主机系统中挂载很多的远端NVMe磁盘，由智能网卡直接完成映射，更加安全。

安全功能卸载硬件信任根

硬件信任根在安全领域是其它安全功能的基础，主要表现如下方面：

（1）硬件信任根（Root-Of-Trust）：硬件信任根提供更离散的密钥生成算法，并且与主机操作系统相隔离，可以做到硬件防破解。硬件信任根实现私有密钥存储，可以反克隆和签名。通过硬件信任根认证授权实现访问受控。

（2）加密解密（Encryption/Decryption）：数据加密解密算法完全卸载到硬件网卡，无需主机CPU资源，效率更高更可靠。可以实现通用加密算法和国密算法等。

（3）密钥证书管理（KMS）：密钥证书管理卸载到智能网卡，与主机系统相隔离；支持多种密钥交换算法，如D-H密钥交换等。

（4）动态数据安全（Secure Data-in-Motion）：利用硬件级加解密算法，对传输通道上的数据做加解密处理，如IPSec和TLS等。硬件处理可以实现更高吞吐量。

（5）静态数据安全（Secure Data-at-Rest）：在存储服务中，永久存盘的数据需要进行加密，防止被窃取，硬件级数据加解密在存储服务中可以提供更高效的数据读取，并保证数据安全。

（6）流日志和流分析（Flowlog）：流分析和流日志监控，对数据中心流量做精细监控，有效识别，可以及时识别DDoS攻击，并做出响应。

安全服务应用

在安全领域，还有很多的安全功能产品，如NGFW，WAF，IPS/IDS，DDoS防御设备等。随着云和虚拟化技术的发展，越来越多的安全功能产品的实现方式转为虚拟化方式，并通过云平台来部署管理。这些安全功能产品由于部署在数据中心流量的主要路径上，转发性能对整体网络的吞吐量和时延具有重要的影响。基于X86的软件实现方式，需要大量CPU资源来处理对应的业务逻辑，性能上的瓶颈已经愈发明显。通过智能网卡对这些安全功能产品做硬件加速，已经是必然趋势。

由于安全功能产品对报文处理的深度不同，有些只需要在二至四层处理，有些则需要在七层进行处理，所以在智能网卡的卸载方式上，也存在不同。如NGFW和DDoS等设备，可以通过流表卸载的方式，对流量进行拦截，来加速运行在主机系统中的安全服务应用。如IPS/IDS等，需要对报文内容做深度检测，则可以通过in-line的方式将数据深度检测功能卸载到智能网卡的CPU上，这时需要智能网卡的CPU具有较强的性能。

隔离网络虚拟化

在传统的网卡上做云平台虚拟化，Hypervisor以及对应的虚拟化网络的实现，都是在主机操作系统上实现的。这样如果黑客如果攻陷了Hypervisor并拿到主机操作系统的root权限，就可以通过篡改虚拟化网络配置，来对租户网络进行攻击，甚至可以渗透到其它计算节点，进行更大范围的攻击。

引入DPU智能网卡之后，将虚拟化网络的控制平面完全卸载到智能网卡上，与主机操作系统相隔离。即使黑客攻陷了Hypervisor，获取了主机操作系统的root权限，也无法篡改虚拟化网络的配置，这样可以将黑客的攻击范围限制在主机操作系统上，不会影响到虚拟化网络以及其它主机。进而达到了安全隔离的效果。

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据中心

数据中心

+关注

关注
16

文章
4790

浏览量
72161
DPU

DPU

+关注

关注
0

文章
364

浏览量
24200
智能网卡

智能网卡

+关注

关注
1

文章
53

浏览量
12237

原文标题：详解DPU存储、安全卸载及架构

文章出处：【微信号：AI_Architect，微信公众号：智能计算芯世界】欢迎添加关注！文章转载请注明出处。

中科驭数凭借在DPU芯片领域的积累被认定为北京市知识产权优势单位

。作为DPU新型算力基础设施领军企业，中科驭数一直致力于推动DPU领域的技术创新和最佳实践，并将知识产权视为推动企业发展的重要力量之一。以DPU软硬件为核心，中科驭数技术布局涵盖了从芯片底层

发表于 12-31 18:49 •166次阅读

一文详解计算型存储协议框架

近年来，AI应用态势迅猛增加，对计算侧的算力和内存提出了更高的要求。GPU、HBM这些高性能高密计算部件和内存部件，在AI计算场景中作为必需品，成为市场热点。业界也在讨论能否把计算侧的业务卸载到存储

发表于 10-31 14:20 •401次阅读

可编程交换机如何无缝卸载集体操作

。最后，Sharada Yeluri 以Juniper 的 Trio 架构为例，展示了可编程交换机如何无缝卸载集体操作。

发表于 10-22 16:04 •239次阅读

基于DPU的OpenStack裸金属服务快速部署及存储解决方案

Openstack作为开源云计算领域的领军项目，凭借其强大的功能、灵活的架构以及活跃的社区支持，在全球范围内得到了广泛的采用。通过Openstack，企业和云服务提供商可以更加高效地管理和利用计算资源、存储资源和网络资源，实现业务的快速部署和灵活扩展，从而赢得市场竞争的先

发表于 09-29 14:24 •414次阅读

服务网格DPU卸载解决方案

服务网格（Service Mesh）是微服务架构中的一种重要技术，它主要处理服务之间的通信，为服务间的信息交换提供更安全、更快速且更可靠的基础设施层。服务网格将服务治理从业务逻辑中剥离出来，拆解为独立的进程，实现异构系统的统一治理和增强网络

发表于 09-20 16:25 •321次阅读

IaaS+on+DPU(IoD)+下一代高性能算力底座技术白皮书

数据中心的第三颗“主力芯片”，主要通过其专用处理器优化数据中心的网络、存储、安全等处理性能，助力服务器运行效率显著提升，有效降低成本。因此，在新型数据中心建设时，围绕 DPU 构建数据中心网络的基础设施

发表于 07-24 15:32

基于DPU的Ceph存储解决方案

1. 方案背景和挑战 Ceph是一个高度可扩展、高性能的开源分布式存储系统，设计用于提供优秀的对象存储、块存储和文件存储服务。它的几个核心特点是：弹性扩展： Ceph能够无缝地水平扩

发表于 07-15 13:44 •1329次阅读

中科驭数：DPU是构建高效智算中心基础设施的必选项

先生在《基于DPU的高效智算中心算力底座》主题分享中提出，大模型等智算业务推动算力需求规模快速增长，CPU+GPU+DPU的新型计算节点架构已成为高效智算中心的标准配置，为构建高性能、高灵活性、高

发表于 07-08 10:51 •713次阅读

带你走进信息安全软件架构

经纬恒润车端信息安全解决方案整合了 MCU 端以及 MPU 端的信息安全解决方案，具体方案包括 Security Boot、安全通信、安全存储

发表于 06-12 14:36 •898次阅读

基于芯启源NFP3800DPU芯片的深信服安全加速卡XSX40FNN网卡

近日，国内DPU领域的领军企业芯启源宣布，基于芯启源NFP3800DPU芯片定制的深信服安全加速卡XSX40FNN网卡已成功应用于其防火墙产品，并已批量推向市场。

发表于 05-29 14:06 •977次阅读

鸿蒙ArkTS声明式开发：跨平台支持列表【挂载卸载事件】

挂载卸载事件指组件从组件树上挂载、卸载时触发的事件。

发表于 05-27 14:42 •371次阅读

明天线上见！DPU构建高性能云算力底座——DPU技术开放日最新议程公布！

算力，是数字经济时代的新质生产力。随着人工智能、智算中心建设等需求不断拓展，DPU在各行各业数据中心的应用逐步深入。异构算力代表DPU在新质生产力建设中，能否给出别开生面的答案，应战算力难题？DPU

发表于 04-03 18:12 •1008次阅读

中科驭数DPU技术开放日秀“肌肉”：云原生网络、RDMA、安全加速、低延时网络等方案组团亮相

DPU技术开放日既是对DPU技术应用的典型方案展示，也是DPU技术在重要细分场景走向成熟的标志。

发表于 04-01 11:48 •796次阅读

兴汉携手芯启源发布一款为网络防火墙量身定制的DPU安全卸载模块

北京兴汉网际股份有限公司（NEXSEC）与芯启源电子科技有限公司（Corigine）携手，经过一整年的潜心研发与努力，正式发布了LAG 4A20—— 一款为网络防火墙量身定制的DPU安全卸载模块。

发表于 03-01 15:24 •911次阅读

星云智联首款自研DPU ASIC芯片一版流片成功

，以及全体星云人的不懈努力。 M18120是星云智联推出的首款DPU ASIC芯片，集成了公司自主研发的网络、存储、安全、RDMA、可编程转发等核心技术，最大吞吐性能达到200Gbps，能够满足公有云、混合云、私有云、NVMe

发表于 01-26 14:34 •699次阅读