0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

借助 NVIDIA DPU 和 NVIDIA DOCA 为人工智能时代的数据中心带来变革

NVIDIA英伟达企业解决方案 来源:未知 2023-03-29 03:40 次阅读

正如 NVIDIA GTC 2023 的宣布,NVIDIA BlueField-3 DPU(数据处理器)现已全面投产,并被 Oracle 云基础设施(OCI)选择来实现更高的性能,更优的效率和更强的安全性。

作为一个 400 Gb/s 的基础设施计算平台,BlueField-3 DPU 使企业能够大规模部署和运营数据中心NVIDIA DOCA 软件框架现在已支持 BlueField-3 DPU,使成千上万的开发者能够利用第三代 DPU 平台的强大功能来快速创建加速的应用程序和服务。

从数据中心到人工智能工厂


数据中心是新兴的人工智能驱动型经济的核心,数据是原材料,人工智能算法是将数据转化为有价值见解的处理引擎。BlueField-3 DPU 是为全球数据中心提供动力的 NVIDIA 加速计算堆栈的基础。通过卸载、加速和隔离数据中心控制平面,BlueField-3 DPU 创建了一个安全、加速和可持续的基础设施,用于在节点集群中运行人工智能和其他现代工作负载,并作为一个统一的计算平台运行。

BlueField-3 DPU 专为数据中心规模的计算而设计,提供 400 Gb/s 以太网和 InfiniBand 网络连接,相比上一代可支持高达 4 倍的计算能力、高达 4 倍的加密加速性能、2 倍的存储处理性能和 4 倍的内存带宽,同时通过 NVIDIA DOCA 软件框架提供完全的向后兼容性。

NVIDIA DOCA 引领加速云服务的发展


NVIDIA DOCA 是专为 BlueField DPU 而设计的软件开发套件和加速框架。DOCA 旨在通过为 BlueField DPU 快速创建和部署应用程序和服务来解锁数据中心创新。

NVIDIA DOCA 拥有丰富的库、驱动程序和 API,可为 BlueField DPU 开发者提供 “一站式服务”,同时也是加速云基础设施服务的关键。这使得 NVIDIA DOCA 成为 NVIDIA 人工智能云服务战略的关键组成部分,该战略旨在为加速数据中心工作负载和大规模部署人工智能应用程序提供一个灵活而强大的平台。

目前,全球已有超过 4700 名注册早期访问的开发者使用 NVIDIA DOCA 来创建 BlueField DPU 应用程序,NVIDIA 很高兴的宣布 NVIDIA DOCA 全面面市,并向所有人开放访问。
图 1 . NVIDIA DOCA 2.0 软件框架

NVIDIA DOCA 2.0

支持全新的 BlueField-3 用例


最新发布的 NVIDIA DOCA 2.0 增加了对 BlueField-3 数据路径加速器( DPA )编程子系统的支持,包括 DOCA IPsec 加密/解密库、设备认证和 YARA 规则在内的多项安全增强功能。还包括对 DOCA Flow 库的增强功能。

NVIDIA DOCA 可为

BlueField-3 DPA 提供可编程性


NVIDIA DOCA 2.0 添加了增强功能,以利用 BlueField-3 DPA 编程子系统。DPA 是一种高度可编程的嵌入式处理器,存在于 BlueField-3 DPU 中。它专为网络密集型、低计算量任务而构建,如设备仿真、拥塞控制、自定义协议等。


NVIDIA DOCA DPA 库是 NVIDIA DOCA 软件开发套件的一部分,它提供了一种编程模型,用于卸载以网络为中心的代码,并在 DPA 处理器上运行。DPA 有助于从 CPU 卸载更多类型的流量,并通过 DPU 加速来提高性能。


将用于设备仿真的 VirtIO

卸载到 BlueField-3 DPA


在使用 VirtIO-net 进行设备仿真时,NVIDIA DOCA 和带有 DPA 的 BlueField-3 DPU 比以前的选项有了显著的改进。在虚拟化环境中,虚拟机(VM)需要像物理机一样访问网络。


在此示例中,虚拟机通常调用 CPU 来处理特定任务,例如访问网卡。将此任务从 CPU 卸载到 BlueField-3 DPU 上专门构建的 DPA 引擎,可实现比 BlueField-2 DPU 高 2 倍的性能,以更高的效率来助力降低数据中心功耗。这有效地消除了数据中心网络税,否则就会占用本该用于应用程序的 CPU 核心资源。


借助 NVIDIA DOCA IPsec 的安全通信


IPsec 是一种安全协议,提供加密、身份验证和完整性服务,以保护 IP 数据包免受未经授权的访问、篡改或窃听。对安全和高速通信的需求日益增长,这给传统基于 CPU 的 IPsec 处理带来了压力,使卸载成为一种有吸引力的解决方案。


在加速防火墙解决方案中,将 IPsec 卸载到 BlueField-3 DPU 可以优化安全性并加速性能。穿过防火墙的流量可以卸载到 DPU,并通过 IPsec 隧道发送到接收主机,例如,提供具有 200 Gbps 双向流量的 32K 并发 IPsec 隧道。这降低了 CPU 的利用率,并通过快速、高效的方法管理可信流量。需要进行威胁检查的剩余流量通过主机和 CPU 进行路由。此过程现已得到优化,由于 CPU 不再管理 IPsec 流量,因此防火墙应用程序可提供更好的性能。


DOCA IPsec 库的添加为下一代防火墙(NGFW)应用程序带来了显著的优势。库中包含的资源池,包括消息模板、预写代码和子例程,有助于简化整个开发流程并减少上市时间。DOCA IPsec 库与 DOCA Flow 库相互操作,使开发者能够将多个 DOCA Flow 管道链接在一起,用于各种网络管线设计(例如,DOCA Flow NAT 管道)。


最后,NVIDIA DOCA 现在能够以更高的速率对新路由和 NAT 表进行编程,使以接近线速速率进行 IPsec 加密和解密既可行又实用,同时减轻了 CPU 的负担。


5G 工作负载的高效 GPU 通信


NVIDIA Aerial 是一个用于构建高性能、软件定义 5G L1 堆栈的软件开发套件,并通过 GPU 的并行处理进行了优化。具体而言,NVIDIA Aerial 软件开发套件可用于构建基带单元(BBU)软件,该软件负责发送(下行链路)或接收(上行链路)的无线客户端数据帧,这些数据帧通过无线电单元(RU)分拆为多个以太网数据包。


在上行链路中,BBU 接收分组,验证它们,并在触发信号处理之前重建每个 RU 的原始数据帧。使用 NVIDIA Aerial 软件开发套件,这将发生在 GPU 中,每个时隙的 RU 都有一个专用的 CUDA 内核。然而,随着基站数量的增加,在网卡和 GPU 之间运行的 CPU 成为了瓶颈。


NVIDIA DOCA 软件框架提供了一种将 CPU 从关键路径中移除并实现网卡和 CUDA 内核之间的直接通信的方法(GPUDirect 异步内核启动技术)新的 DOCA GPUNetIO 库提供了 CUDA 设备功能,应用程序可以在 CUDA 内核中调用这些功能,以便直接向 GPU 发送或从 GPU 接收数据包,而无需使用 CPU 核心或内存。


通过这种方式,NVIDIA Aerial BBU 软件可以提供一种高度并行化和可扩展的方法,每个基站都有一个专用的 CUDA 内核来接收数据包。这使系统容量提高了 4 倍(从采用以 CPU 为中心的 4 个基站到通过 DOCA GPUNetIO 的以 GPU 为中心的 16 个基站)。


CPU 不再需要与 GPU 通信来提供数据包信息,使 CPU 能够专注于应用程序处理,而不是管理网络开销。


扫描下方二维码,立即注册 NVIDIA DOCA GPUNetIO 抢先体验计划。



加速人工智能服务


为了充分发挥人工智能的潜力,数据中心正转向加速计算,以满足日益增长的计算需求。BlueField-3 DPU 是第三代基础设施计算平台,支持 400 Gb/s 网络连接,并提供前所未有的计算和加速能力。在 NVIDIA DOCA 2.0 版本的支持下,BlueField-3 DPU 正在为人工智能时代云、超级计算和企业数据中心带来变革。

NVIDIA DOCA 现已开放接受申请,扫描下方二维码即可注册体验!





扫描海报二维码,或点击“阅读原文”,即可观看 NVIDIA 创始人兼首席执行官黄仁勋 GTC23 主题演讲重播!



原文标题:借助 NVIDIA DPU 和 NVIDIA DOCA 为人工智能时代的数据中心带来变革

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3771

    浏览量

    90994

原文标题:借助 NVIDIA DPU 和 NVIDIA DOCA 为人工智能时代的数据中心带来变革

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA DOCA 2.9版本的亮点解析

    NVIDIA DOCA通过为开发者提供全面的软件框架以利用硬件加速来增强 NVIDIA 网络平台的功能,从而提高性能、安全性和效率。其 API、库和工具生态系统简化了数据中心基础设施的
    的头像 发表于 11-27 11:15 298次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DOCA</b> 2.9版本的亮点解析

    嵌入式和人工智能究竟是什么关系?

    理这些数据,提高系统的响应速度和准确性。此外,嵌入式系统还可以为人工智能提供安全和隐私保护,避免数据泄露和攻击。总之,嵌入式系统和人工智能是相辅相成的,它们在许多领域都有广阔的应用前景
    发表于 11-14 16:39

    人工智能对数据中心的挑战

    在加密货币和人工智能/机器学习(AI/ML)等新兴应用的驱动下,数据中心的能耗巨大,并将快速增长以满足用户需求。根据国际能源署(IEA)的最新报告,2022 年数据中心的耗电量将达到 460 TWh
    的头像 发表于 11-13 16:05 364次阅读
    <b class='flag-5'>人工智能对数据中心</b>的挑战

    NVIDIA DOCA-OFED的主要特性

    NVIDIA DOCA 软件平台释放了 NVIDIA BlueField 网络平台的潜力,并为NVIDIA BlueField和ConnectX设备提供了所需的所有主机驱动程序。
    的头像 发表于 11-09 13:50 257次阅读

    IB Verbs和NVIDIA DOCA GPUNetIO性能测试

    NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一个库,专门为实时在线 GPU 数据包处理而设计。它结合了
    的头像 发表于 08-23 17:03 593次阅读
    IB Verbs和<b class='flag-5'>NVIDIA</b> <b class='flag-5'>DOCA</b> GPUNetIO性能测试

    借助电源完整性测试提高人工智能数据中心的能效

    数据中心正在部署基于人工智能 (AI) 的技术,处理器密集型服务器正在推动能源需求的增长,下表说明了这种发展趋势所带来的巨大影响。国际能源署 (IEA) 预测,到2030年,数据中心
    的头像 发表于 07-30 09:36 536次阅读
    <b class='flag-5'>借助</b>电源完整性测试提高<b class='flag-5'>人工智能</b><b class='flag-5'>数据中心</b>的能效

    人工智能数据中心的新型连接解决方案

    支持新型人工智能数据中心架构的先进连接解决方案不断涌现。高速板对板连接器、下一代电缆、背板和近似集成电路连接器对电缆解决方案的运行速度高达224Gb/s-PAM4,将加速未来计算的发展。人工智能
    的头像 发表于 06-13 08:26 550次阅读
    <b class='flag-5'>人工智能</b><b class='flag-5'>数据中心</b>的新型连接解决方案

    夏普讨论建立人工智能数据中心

    近日,夏普公司宣布与KDDI公司达成重要合作意向,双方将针对建立人工智能数据中心进行深入讨论。据悉,此次合作将围绕英伟达的人工智能计算平台和Supermicro平台展开,共同探索人工智能
    的头像 发表于 06-05 09:17 462次阅读

    借助NVIDIA DOCA 2.7增强AI 云数据中心NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架为开发者提供了丰富的库、驱动和 API,以便为 NVIDIA BlueField DPU 和 SuperNIC 创建高性能的应用程序和服务。
    的头像 发表于 05-29 09:22 486次阅读

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    、库及优化的AI模型和应用程序,为用户提供全面的AI计算解决方案。 DGX SuperPOD - 专为人工智能设计的数据中心 NVIDIA 发布专为训练和推理万亿参数生成式AI模型而设计的数据
    发表于 05-13 17:16

    嵌入式人工智能的就业方向有哪些?

    嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式
    发表于 02-26 10:17

    基于NVIDIA DOCA 2.6实现高性能和安全的AI云设计

    作为专为 NVIDIA® BlueField® 网络平台而设计的数据中心基础设施软件框架,NVIDIA® DOCA™ 使广大开发者能够利用其行业标准 API 在
    的头像 发表于 02-23 10:02 470次阅读

    NVIDIA DOCA 2.5 长期支持版本发布

    正值 NVIDIA DOCA 面世三周年之际,NVIDIA 于近日发布了适用于 NVIDIA BlueField-3 网络平台的 NVIDIA
    的头像 发表于 12-26 18:25 404次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DOCA</b> 2.5 长期支持版本发布

    NVIDIA 人工智能开讲 | 什么是 AI For Science?详解 AI 助力科学研究领域的新突破

    NVIDIA 中国推出的人工智能类音频节目再次开讲啦,在这里,你将与 NVIDIA 共同见证人工智能的磅礴力量与无限可能! 如果你也想度过科技相伴的时光,赶快在“ 喜马拉雅FM ”
    的头像 发表于 12-25 18:30 1002次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>人工智能</b>开讲 | 什么是 AI For Science?详解 AI 助力科学研究领域的新突破

    数据处理器:DPU编程入门》DPU计算入门书籍测评

    实践 最后一部分是数据加速应用的落地: 基于各个平台的算力解决方案 推荐的存储解决方案 边缘计算方案 网络平台与融合加速技术 本书不能帮你完全入门DOCA和相关的DPU开发技术,但是能够帮读者建立起一
    发表于 12-24 10:54