0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是 BlueField SuperNIC?

NVIDIA英伟达 来源:未知 2023-11-21 21:50 次阅读

BlueField SuperNIC 是面向 AI 云数据中心的一种网络加速器,可在 GPU 服务器之间提供可靠、无缝的连接。

wKgaomVctrmAU3JlAADoI3vg6BQ608.jpg

生成式 AI 是快速变化的数字领域的新转折。在此领域的一个突破性创新技术是一个新术语:BlueField SuperNIC

什么是 BlueField SuperNIC?

BlueField SuperNIC 是一类新型网络加速器,旨在为基于以太网的 AI 云上运行的超大规模 AI 工作负载提供强效助力。它为 GPU 到 GPU 通信提供快速的网络连接,使用基于以太网的远程直接内存访问(RoCE)技术实现 400Gb/s 的速度。

BlueField SuperNIC 结合了以下独特属性:

  • 高速数据包重排序可确保数据包的接收和处理顺序与源端发送的顺序相同。这可保持数据流的顺序完整性。

  • 使用实时遥测数据和网络感知算法进行高级拥塞控制,以管理和预防 AI 网络中的拥塞。

  • 输入/输出 (I/O) 路径上的可编程计算,可实现 AI 云数据中心网络基础设施的自定义和可扩展性。

  • 节能高效的半高设计,可在有限的功率预算范围内高效适应 AI 工作负载。

  • 全栈 AI 优化,包括计算、网络、存储、系统软件、通信库和应用框架。

NVIDIA 最近推出了全球首款专为 AI 计算定制的 BlueField SuperNIC,基于 BlueField-3 网络平台。它是 NVIDIA Spectrum-X 平台的一部分,与 Spectrum-4 以太网交换机系统无缝集成。

NVIDIA BlueField-3 SuperNIC 和 Spectrum-4 交换机系统共同构成专为优化 AI 工作负载而设计的加速计算架构。Spectrum-X 始终如一地提供极高网络效率水平,远超传统的以太网环境。

NVIDIA DPU 和网卡产品副总裁 Yael Shenhav 表示:“AI 正在推动新一波的技术创新,BlueField-3 SuperNIC 是其中至关重要的一个齿轮。BlueField SuperNIC 可确保您的 AI 工作负载得到高效和快速的执行,必将成为实现 AI 计算未来的基础组件。”

不断发展的 AI 和网络格局

AI 领域正在经历一场地震级转变,这要归功于生成式 AI 和大语言模型,这些强大的技术释放了新的可能性,使计算机能够处理新任务。

AI 的成功很大程度上依赖于 GPU 加速计算来处理海量数据、训练大型 AI 模型并实现实时推理。这种新的计算能力开辟了新的可能性,但也对以太网云网络提出了挑战。

传统以太网是互联网基础设施的基础技术,旨在提供广泛的兼容性和连接松耦合的应用程序。它的设计并不是为了满足现代 AI 工作负载的苛刻计算需求,这些工作负载涉及紧耦合的并行处理、快速数据传输和独特的通信模式,所有这些都需要优化的网络连接。

传统网络接口卡(NIC)为通用计算、通用数据传输和互操作性而设计,并没有为 AI 工作负载计算强度带来的独特挑战进行优化设计。

标准网卡(NIC)缺乏必要的特性和功能来实现高效的数据传输、低延迟和对 AI 任务至关重要的确定性能。而 BlueField SuperNIC 则专为现代 AI 工作负载而构建。

AI 计算环境中的 BlueField SuperNIC 优势

数据处理器(DPU)提供丰富的高级功能,可提供高吞吐量、低延迟的网络连接等。自 2020 年推出以来,DPU 在云计算领域越来越受欢迎,主要是因为其能够卸载、加速和隔离数据中心基础设施处理。

尽管 DPU 和 BlueField SuperNIC 具有一系列相同的特性和功能,但 BlueField SuperNIC 针对 AI 加速网络进行了独特的优化。下图显示了它们的对比情况:

wKgaomVctrmAXQeYAADCs1figRI395.png

分布式 AI 训练和推理通信流很大程度上取决于网络带宽的可用性。BlueField SuperNIC 以其独特的设计而引人注目,其扩展比 DPU 更有效,每个 GPU 可提供惊人的 400Gb/s 网络带宽。

系统内 GPU 与 BlueField SuperNIC 的 1:1 配比可以显著提高 AI 工作负载效率,从而提高企业的生产力和卓越成果。

BlueField SuperNIC 的唯一目的是加速 AI 云计算的网络。因此,它比 DPU 消耗更少的计算能力,而 DPU 需要大量计算资源来卸载主机 CPU 中的应用程序。

计算需求的降低也转化为功耗的降低,这在包含多达 8 个 BlueField SuperNIC 的系统中尤为重要。

BlueField SuperNIC 的其他显著特性包括其专用的 AI 网络功能。当与为 AI 优化的 NVIDIA Spectrum-4 交换机紧密集成时,它提供了自适应路由、乱序数据包处理和优化的拥塞控制。这些高级功能有助于加速以太网 AI 云环境。

革新 AI 云计算

NVIDIA BlueField-3 SuperNIC 具有多项优势,是 AI 基础设施就绪的关键:

  • AI 工作负载峰值效率:BlueField-3 SuperNIC 专为网络密集型大规模并行计算而构建,是 AI 工作负载的理想选择。它可确保 AI 任务高效运行,消除通信瓶颈。

  • 一致且可预测的性能:在同时处理大量任务的多租户数据中心,BlueField-3 SuperNIC 可确保每个作业和租户的性能都是隔离的、可预测的,并且不受其他网络活动的影响。

  • 安全的多租户云基础设施:安全是重中之重,尤其是在处理敏感信息的数据中心。BlueField-3 SuperNIC 保持极高的安全级别,使多个租户能够共存,同时保持数据和处理隔离。

  • 可扩展的网络基础设施:BlueField-3 SuperNIC 的范围并不受限,它高度灵活,可适应各种其他网络基础设施需求。

  • 广泛的服务器制造商支持:BlueField-3 SuperNIC 无缝适用于大多数企业级服务器,无需额外供电,为数据中心实现高效节能。

扫描下方二维码,阅读白皮书,详细了解 NVIDIA BlueField-3 SuperNIC,包括它们如何跨 NVIDIA 数据中心平台进行集成:新一代网络,迎接新一波 AI 浪潮。

wKgaomVctrmADY7dAAAEHsvLcnE104.png


wKgaomVctrmAQRirAABAFFJlyZc132.gif  

更多精彩内容 利用 NVIDIA DOCA Flow 实现 DPU 加速数据包转向逻辑
使用 NVIDIA BlueField DPU 加速 Suricata IDS / IPS
使用 NVIDIA BlueField-3 DPU 驱动下一波应用程序 wKgaomVctrmABbd7AABAFFJlyZc485.gif    

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。扫描下方海报二维码,立即注册 GTC 大会


原文标题:什么是 BlueField SuperNIC?

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3749

    浏览量

    90848

原文标题:什么是 BlueField SuperNIC?

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA DOCA-OFED的主要特性

    NVIDIA DOCA 软件平台释放了 NVIDIA BlueField 网络平台的潜力,并为NVIDIA BlueField和ConnectX设备提供了所需的所有主机驱动程序。DOCA 针对峰值
    的头像 发表于 11-09 13:50 186次阅读

    NVIDIA SuperNIC推进现代AI基础设施发展

    在生成式 AI 时代,加速网络对于为大规模分布式 AI 工作负载构建高性能计算平台至关重要。NVIDIA 在加速网络领域继续保持领先地位,提供先进的以太网和 InfiniBand 解决方案,可最大限度地提高 AI 工厂和云数据中心的性能和效率。
    的头像 发表于 11-06 13:59 193次阅读

    简单认识NVIDIA网络平台

    BlueField-3 SuperNIC,为多租户生成式 AI 云和大型企业级用户提供了各种至关重要的先进功能。其核心结构是交换机 + SuperNIC(超级网卡)+ LinkX + DOCA 软件开发包 + NCCL 集合通
    的头像 发表于 09-09 09:22 407次阅读

    英伟达Blackwell可支持10万亿参数模型AI训练,实时大语言模型推理

    。                       英伟达Blackwell是通用计算全栈矩阵的终极解决方案,由多个英伟达芯片组成,包括Blackwell GPU、Grace CPU、BlueField数据处理单元、ConnectX网络接口卡
    的头像 发表于 09-04 09:10 2832次阅读

    NVIDIA BlueField-3 DPU助力思科提高工作负载安全性和运营效率

    、位置和外形尺寸的应用程序工作负载。 思科最近发布了Cisco Secure Workload 3.9 版,将企业的安全性和运营效率提升到了新的水平。它提供了新的功能来缓解威胁和漏洞,并为部署微分段(microsegmentation)提供了更大的灵活性。它现在还扩展到NVIDIA BlueField-3 DPU,
    的头像 发表于 06-27 17:31 728次阅读

    借助NVIDIA DOCA 2.7增强AI 云数据中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架为开发者提供了丰富的库、驱动和 API,以便为 NVIDIA BlueField DPU 和 SuperNIC 创建高性能的应用程序和服务。
    的头像 发表于 05-29 09:22 465次阅读

    Nvidia的AI芯片路线图分析与解读

    SmartNIC智能网卡/DPU数据处理引擎的下一跳ConnectX-8/BlueField-4目标速率为 800G,与1.6T Quantum和Spectrum-X配套的SmartNIC和DPU的路标仍不明晰,NVLink5.0和NVSwitch4.0可能提前发力。
    发表于 04-29 09:59 921次阅读
    Nvidia的AI芯片路线图分析与解读

    NVIDIA推出X800网络交换机平台,实现800Gb/s端到端吞吐量

     X800系列包括InfiniBand适用的Quantum-X800和标准以太网适用的Spectrum-X800两个产品线。前者以最高性能理念设计,家族成员包括英伟达Quantum Q3400交换机(具备144个800Gbps端口)及ConnectX-8 SuperNIC智能网卡;
    的头像 发表于 03-19 13:48 934次阅读

    NVIDIA 发布全新交换机,全面优化万亿参数级 GPU 计算和 AI 基础设施

    NVIDIA 软件实现了跨  Blackwell GPU、新交换机和 BlueField-3 SuperNIC 的分布式计算,大幅提升了 AI、数据处理、高性能计算和云工作负载的性能     美国加利福尼亚州
    发表于 03-19 10:05 318次阅读
    NVIDIA 发布全新交换机,全面优化万亿参数级 GPU 计算和 AI 基础设施

    基于NVIDIA DOCA 2.6实现高性能和安全的AI云设计

    网络平台上快速创建应用程序和服务,并启用 NVIDIA BlueField DPU 和 NVIDIA BlueField SuperNIC 的强大功能,提供突破性的网络、安全和存储性能。
    的头像 发表于 02-23 10:02 433次阅读

    普华永道(PWC)与SNP扩大全球合作伙伴关系

    进行更改。对于普华永道来说,软件的灵活性和迁移过程是一个决定性的因素。因此,双方都能够快速响应变化并为复杂的挑战提供精确的服务,从而从合作伙伴关系中受益。   ■ 普华永道和SNP的合作伙伴关系将覆盖未来的国际市场 ■ 继BLUEFIELD™认证和联合项目之后,此次
    的头像 发表于 12-28 13:55 450次阅读

    NVIDIA DOCA 2.5 长期支持版本发布

    正值 NVIDIA DOCA 面世三周年之际,NVIDIA 于近日发布了适用于 NVIDIA BlueField-3 网络平台的 NVIDIA DOCA 2.5 长期支持版 本。 作为面向云和 AI
    的头像 发表于 12-26 18:25 389次阅读
    NVIDIA DOCA 2.5 长期支持版本发布

    SNP Bluefield助力日日顺物流公司进行IT系统代码拆分

    日日顺是海尔集团旗下综合服务品牌,旗下有日日顺物流、日日顺乐家、日日顺乐农等。日日顺物流为家电、家具、卫浴等品类的厂商、线下零售商和电子商务客户提物流服务。日日顺网点遍布全国,深入县、乡、村级地区,日日顺的优势在于大件配送。2018 年,日日顺品牌价值 301.08亿元,成为物联网时代触点迭代生态圈生态品牌;2018年,日日顺荣获中国驰名商标。2019年6月,世界品牌实验室(World Brand Lab)权威发布日日顺成功入选“中国500最具价值品牌
    的头像 发表于 12-18 09:11 401次阅读

    以太网or非以太网?各家AI/ML网络技术盘点

    Nvidia 的 GPU 及其全栈 AI/ML 解决方案使其成为市场中无可争议的上流玩家。 Nvidia DGX Cloud 解决方案将 Quantum-2 (25.6Tbs) InfiniBand 交换机与 ConnectX 和 Bluefield 网络适配器集成。
    发表于 12-13 14:46 877次阅读
    以太网or非以太网?各家AI/ML网络技术盘点

    《数据处理器:DPU编程入门》+初步熟悉这本书的结构和主要内容

    BlueField-3 DPU 的关键软件定义、硬件加速应用包括: 1.云网络:云覆盖、SDN 加速、NAT、负载均衡等。 NVIDIA BlueField-3 DPU 的主要特性和技术规格包括
    发表于 12-08 18:03