0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA LinkX 助力IB网络高速稳定与可靠传输

维维为 来源:维维为 作者:维维为 2022-07-27 17:41 次阅读

InfiniBand(直译为“无限带宽”技术,缩写为IB)是一个用于高性能计算的计算机网络通信标准,是世界领先的超级计算机的互连首选。基于NVIDIA InfiniBand的端到端网络可实现极低的延迟,以及高数据吞吐量和传输速率。

InfiniBand网络主要用于高性能计算(HPC)场景,通过高速的InfiniBand技术,将业务负载由单机运行转化为基于多机协作的高性能计算集群。采用了InfiniBand网络技术,使得高性能集群的性能得以进一步地释放和优化。

作为未来算力的基本单元,高性能的数据中心也越来越多地采用InfiniBand网络方案,尤其是在超算中心中应用最为广泛。

本文中出现的与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。

01

NVIDIA Quantum-2 InfiniBand平台:400Gb/s NDR InfiniBand网络互连

NVIDIA所提供的InfiniBand系列产品主要包括网卡、DPU、交换机以及LinkX线缆和光模块,速率从100Gb/s EDR到200Gb/s HDR再到最新的400Gb/s NDR。NVIDIA最新发布的Quantum-2 InfiniBand平台继续创造高性能网络的更高纪录,包括NVIDIA Quantum-2交换机、ConnectX-7网卡、BlueField-3 DPU、LinkX线缆和光模块,一同构成了面向新一代高性能计算、人工智能机器学习、大数据、云计算、Web 3.0和存储平台的完整400Gb/s NDR InfiniBand网络互连基础设施。

pYYBAGLhCE2ABPwRAABuvnat6YY902.jpg

NDR InfiniBand凭借其最高的数据吞吐量、极低的延迟和智能的网络计算加速引擎,可为要求最苛刻的计算和数据应用提供世界领先的性能和可扩展性。

NVIDIA Quantum-2 InfiniBand平台不但能够实现GPU Direct RDMAAI业务至关重要的技术。其中BlueField-3 DPU增加了DPA 引擎(Data-Path Accelerator)来对特定流量进行编程和加速。ConnectX-7 VPI系列IB网卡对各种通信模型基于网络的计算进行了专门优化,提高了All reduce 和 All-to-All等通信时的通信效率。凭借单端口每秒400Gbps的高吞吐量,NVIDIA Quantum-2 InfiniBand将端口速率提高一倍,网络物理端口数量增加1.5倍。Quantum-2平台的系统容量提升至上代产品的5倍,支持的数据中心的规模提升了6.5倍,而数据中心网络的能耗则降低了36%。

NVIDIA Quantum-2的盒式交换机,芯片采用7nm工艺,包含570亿个晶体管,配有64个400Gbps端口,通过Split线缆以提供多达128个200Gbps端口。交换机的双向总吞吐量为51.2Tb/s,具有超过每秒665亿数据包的标志性包转发能力。同时,Quantum-2平台提供不同端口数的模块化交换机系统,可以支持多达2048个,系统容量超出上一代5倍。基于NVIDIA Quantum-2交换机ASIC的盒式交换机和模块化交换机系统提供了全面的InfiniBand交换互连接解决方案,支持各种InfiniBand网络拓扑,包括Fat Tree、DragonFly+、多维 Torus等。

NVIDIA Quantum-2平台在主机端提供两个网络选项,ConnectX-7网卡和BlueField-3 DPU。ConnectX-7基于7nm工艺,包含80亿个晶体管,其数据传输速率是上一代的两倍,通过RDMA、GPU Direct Storage、GPU Direct RDMA和网络计算加速应用,充分发挥网络的能力。BlueField-3采用7nm工艺,包含220亿个晶体管,提供16个64位ARM CPU,基于数据IO的业务部署,提供加速、卸载和隔离的能力,优化了数据中心基础设施的架构。

为了打造完整的端到端400Gb/s InfiniBand 基础架构,NVIDIA Quantum-2还提供了LinkX解决方案,为用户提供一系列不同类型的400Gb/s DAC线缆(高速铜缆)、AOC线缆(有源光缆)以及光模块产品,以构建复杂的基础设施,可以为选择的拓扑结构提供最大的灵活性,针对不同的连接场景,提供全套的线缆模块方案。

pYYBAGLhCFqAShe4AAK7g1Hzql4213.png

NVIDIA LinkX拥有完善的产品体系,可提供不同的方案组合(光模块、DAC/AOC直连以及分支高速线缆),速率包括EDR(100G)、HDR(200G)和NDR(400G),外形尺寸涵盖QSFP28、QSFP56以及OSFP。

LinkX产品在NVIDIA“端到端”网络系统中发挥了最佳的效果和独特的功能,除了满足InfiniBand贸易协会 (IBTA) 标准外,LinkX产品在出厂之前完成了100% 真实业务测试,确保线缆模块的品质,从底层支持InfiniBand网络实现高性能。NVIDIA LinkX产品的低误码率、低延时、低功耗和高可靠性等特点可以与NVIDIA交换机和网卡产品完美适配,在具有严格要求的超级计算机和超大规模系统中提供了最优的传输效率。

02

构建InfiniBand网络出现的常见问题

目前市面上有部分客户在构建InfiniBand网络时使用了第三方的光模块、高速线缆等连接件产品,然而却在实际应用中出现了大量的问题,主要表现为:

1、网络链路不稳定:出现链路震荡现象

2、传输延时高:在推理、训练等业务负载下,大大延长训练周期

3、功耗高:产品发热异常,严重时甚至可能损坏设备

4、产品质量良莠不齐:经常出现大批量无法使用的情况

纳多德NADDOD——作为NVIDIA网络产品Elite Partner (精英级别合作伙伴),致力于为客户提供高品质高性能光网络解决方案,在为客户搭建高性能网络方案的过程中,收到不少因使用第三方InfiniBand连接件而出现售后问题的反馈,导致用户网络延迟甚至中断,额外增加了客户处理售后问题所花费的时间成本。

结合大量真实案例中出现的情况,纳多德NADDOD建议在InfiniBand网络中使用的连接件(DAC/AOC线缆、光模块),一定要选用NVIDIA LinkX原厂线缆,以最大程度地保证连接件与设备之间的适配性,以及保障网络的稳定传输与高可靠性。

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4985

    浏览量

    103027
  • InfiniBand
    +关注

    关注

    1

    文章

    29

    浏览量

    9196
  • 英伟达
    +关注

    关注

    22

    文章

    3773

    浏览量

    91029
收藏 人收藏

    评论

    相关推荐

    RS232接口数据传输稳定

    电子设备之间的数据传输。它具有较高的传输可靠性,能够在复杂的工业环境和远距离通信场景中,确保数据的可靠传输,减少数据丢失和错误的发生。 二、
    的头像 发表于 12-18 17:56 355次阅读

    华为路由BE7系列助力网络稳定覆盖

    华为华为路由BE7以创新科技引领智能互联新风尚。其设计简约而不失高端感,性能卓越,轻松应对大户型及复杂网络环境,确保信号稳定覆盖每个角落,实现高速稳定上网体验。
    的头像 发表于 09-24 15:20 612次阅读
    华为路由BE7系列<b class='flag-5'>助力</b><b class='flag-5'>网络</b><b class='flag-5'>稳定</b>覆盖

    工业交换机如何增强网络连接的可靠

    在现代工业环境中,网络连接的可靠性至关重要,尤其是在需要实时数据传输和控制的应用场景中。工业交换机作为网络设备,扮演着关键的角色。它们通过多种技术和设计理念来增强
    的头像 发表于 09-12 11:06 290次阅读
    工业交换机如何增强<b class='flag-5'>网络</b>连接的<b class='flag-5'>可靠</b>性

    简单认识NVIDIA网络平台

    NVIDIA Spectrum-X800 平台是业界第一代 800Gb/s 的以太网网络平台,包括了 NVIDIA Spectrum SN5600 800Gb/s 以太网交换机和 NVIDIA
    的头像 发表于 09-09 09:22 426次阅读

    IB Verbs和NVIDIA DOCA GPUNetIO性能测试

    NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一个库,专门为实时在线 GPU 数据包处理而设计。它结合了 GPUDirect RDMA 和 GPUDirect
    的头像 发表于 08-23 17:03 607次阅读
    <b class='flag-5'>IB</b> Verbs和<b class='flag-5'>NVIDIA</b> DOCA GPUNetIO性能测试

    基于100G-PAM4技术的LinkX 线缆

    LinkX线缆专注于加速数据中心和人工智能计算系统,这些产品不仅提供了高数据传输速率,还在设计上特别优化了低延迟性能,以满足现代计算系统对速度和效率的高要求。
    的头像 发表于 08-02 14:10 311次阅读
    基于100G-PAM4技术的<b class='flag-5'>LinkX</b> 线缆

    GPS校时器 NTP网络校时服务器 助力高速收费-安徽京准

    GPS校时器(NTP网络校时服务器)助力高速收费-安徽京准
    的头像 发表于 07-16 16:09 438次阅读
    GPS校时器 NTP<b class='flag-5'>网络</b>校时服务器 <b class='flag-5'>助力</b><b class='flag-5'>高速</b>收费-安徽京准

    稳定可靠网络连接解决方案

    工业路由器是专为工业应用设计的网络设备,具备高速数据传输、智能管理等特点,广泛应用于制造业、能源、物流等领域。其高稳定性、高效数据传输、智能
    的头像 发表于 04-07 18:20 1122次阅读

    光纤布线如何保证数据可靠传输

    在当今的数字环境中,数据传输是技术进步的命脉,通信网络稳定性和可靠性至关重要。随着对更快、更高效的数据传输的需求不断增长,创新者不断寻求解
    的头像 发表于 04-07 10:34 355次阅读

    网络解码矩阵:医院高清视频传输可靠保障

    在现代医疗体系中,高清视频传输扮演着举足轻重的角色。无论是远程手术指导、实时病情监控,还是患者日常护理,高清视频都为医疗工作提供了极大的便利。而在这背后,讯维网络解码矩阵以其高效、稳定的性能,为医院
    的头像 发表于 03-25 17:26 421次阅读
    <b class='flag-5'>网络</b>解码矩阵:医院高清视频<b class='flag-5'>传输</b>的<b class='flag-5'>可靠</b>保障

    介绍一种高性能计算和数据中心网络架构:InfiniBand(IB

    InfiniBand(IB)是一种高性能计算和数据中心网络架构,其设计目标是通过提供低延迟、高带宽以及可扩展性来满足大规模计算和数据传输的需求。让我们深入了解InfiniBand的基本概念。
    的头像 发表于 03-13 17:14 1548次阅读

    光传送网(OTN)助力实现超高速、高带宽数据传输

    光传送网(OTN)是一种基于光纤通信技术的网络架构,用于实现光信号的传输和交换。它采用光传输技术将数据以光信号的形式传送,提供高容量、低延迟和可靠的数据
    发表于 03-01 11:21 6655次阅读
    光传送网(OTN)<b class='flag-5'>助力</b>实现超<b class='flag-5'>高速</b>、高带宽数据<b class='flag-5'>传输</b>

    多业务光端机助力5G网络发展:实现更高速、更稳定的连接

    随着5G技术的快速发展和广泛应用,人们对网络速度和稳定性的要求也越来越高。多业务光端机作为一种高速、高效的光通信设备,正逐渐成为5G网络建设中不可或缺的关键设备,为5G
    的头像 发表于 02-23 14:08 607次阅读

    10GBase-T万兆电口模块助力数据中心实现高效数据传输

    10GBase-T万兆电口模块是一种高速、高效的网络连接解决方案,具有快速传输速度和稳定可靠的特点。它可以在数据中心中广泛应用,提供出色的
    的头像 发表于 02-21 16:16 408次阅读

    桂花网蓝牙温度监测方案:实现稳定可靠的无线温度监测

    ,温度数据能够实时传输到远程监控中心或移动设备上,便于用户实时掌握温度情况。三、技术特点 稳定可靠:桂花网的蓝牙网关具备出色的稳定性和可靠
    发表于 01-30 14:25