0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于NVIDIA QM8700/8790交换机与HDR网卡的InfiniBand高性能网络解决方案

维维为 来源:维维为 作者:维维为 2022-11-03 17:57 次阅读

水之积也不厚,则其负大舟也无力,如果将高性能计算、机器学习、大数据、云、web3.0 、存储平台等应用看作“舟”,那InfiniBand网络无疑是承载这些大舟的水。随着数据的爆发式增长,这些应用对网络带宽、延时、效率的要求不断提升,面对这些挑战,NVIDIA也相继推出InfiniBand 100G EDR、200G HDR以及400G NDR的解决方案。

纳多德是NVIDIA网络产品的Elite Partner,在InfiniBand高性能网络建设与应用加速方面拥有深刻的业务理解和丰富的项目实施经验。纳多德基于QM8700、QM8790交换机、HDR网卡与AOC/DAC/光模块,构建InfiniBand高性能网络,提供更出色的数据吞吐和网络计算能力,满足越来越高的计算需求。

什么是InfiniBand?

InfiniBand (IB) 是一个计算机网络通信标准,在高性能计算(HPC)领域有广泛的应用,可以提供高吞吐带宽和超低的网络传输时延。IB可以用于计算机内部或外部的数据互联。通过直连或者交换机互联的方式,提供服务器与存储,存储设备之间的高性能网络。IB网络可以通过交换机网络实现横向扩展,适应各种规模的组网需求。

poYBAGNjkIOAEPRdAAFYAGPIjCw370.png

图一 InfiniBand速率演进

作为计算机集群互联技术,IB技术相比以太网/Fibre Channel 和已经淘汰的Omni-Path技术有明显的优势,是InfiniBand Trade Association(IBTA)主要推荐的网络通信技术。从2014年开始,大多数的TOP500 超级计算机都采用了InfiniBand网络技术。近些年,AI/大数据相关的应用,也已经大规模的采用IB网络实现高性能的集群部署,其中Top100的超算中心有62%是使用的IB技术(2022年6月数据)。

pYYBAGNjkIOAdjJoAAB-q0EIc_0148.png

图二 Top 100超算中心网络选择

InfiniBand较Omni-Path的优势

尽管NVIDIA已经推出了IB 400G NDR的解决方案,但现阶段仍有部分客户在使用100G解决方案。对于100G的高性能网络,常用的方案有Omni-Path和IB两种,虽然速率相同,性能相似,但网络结构差异巨大。以400节点集群为例,使用IB方案只需要15台NVIDIA Quantum 8000系列交换机+200条200G分支线缆与200条200G直连线缆;而使用Omni-Path则需要24台交换机+876条100G直连线缆(384节点)。IB方案在前期的设备成本以及后期运维成本上都极具优势,且整体功耗远低于Omni-Path,更加环保。

pYYBAGNjkIWAD3bYAAFCyARu7H4453.png

图三 InfiniBand方案与Omni-Path方案对比

InfiniBand HDR产品方案介绍

从客户端的需求来看,EDR正逐步退出市场,NDR速率太高,目前只有头部客户尝试使用,HDR凭借HDR 100G与HDR 200G的灵活性得到了广泛应用。在这里,纳多德针对HDR产品方案做详细介绍。

HDR交换机

HDR交换机有两类,一类是HDR CS8500框式交换机,一台29U的交换机提供最多800 个HDR 200Gb/s 端口,每个200G端口支持拆分为2X100G,即可支持1600个HDR100 100Gb/s端口。

另一类是QM8000系列盒式交换机,1U的面板上集成了40个200G QSFP56端口,最多可拆分为80个HDR 100G端口用来下连100G HDR网卡,同时每个端口也支持EDR,与EDR的网卡直连,需要注意的是200G HDR端口只能降速至100G与EDR网卡互联,无法拆分为2X100G连接两张EDR网卡。

poYBAGNjkIeAEL7hAAMHsMIUg0c143.png

图四 QM8700前面板

200G HDR盒式交换机有两种选择:QM8700和QM8790,两个型号交换机唯一区别在管理方式上,QM8700有control口支持带外管理,QM8790则需要NVIDIA Unified Fabric Manager (UFM®) platform进行管理。

pYYBAGNjkIiAXrF2AAKxWSOSyJ4586.png

图五 QM8790前面板

对于QM8700和QM8790,每个型号的交换机都有两种风向选择,其中8790-HS2F为 P2C airflow(前后风道) 风扇模块上蓝色标记,如果不认识标记,也可以用手浮在交换机的进风和出风口来辨别;8790-HS2R为 C2P airflow(后前风道)风扇模块上红色标记。这里P2C和C2P中 P表示Power电源,C表示Cable(线路接口),P2C(Power to Cable),C2P(Cable to Power )这里参照系是Power电源侧为前,Cable线路接口侧为后。

poYBAGNjkIyAXP7yAAIWK_bdPHc749.png

表一 HDR交换机型号参数

QM8700和QM8790在实际使用中一般有两种方式,一是与200G HDR网卡互连,直接使用200G to 200G AOC/DAC即可;还有一种常见的使用方式是与100G HDR网卡互连,需要使用200G to 2X100G线缆,在使用的时候是将交换机的一个物理200G(4X50G) QSFP56端口拆分为2个虚拟的100G(2X50G)端口,在拆分之后该端口的符号从x/y更改为x/ Y /z,其中“x/ Y”表示拆分之前端口的先前符号,“z”表示产生的单车道端口的编号(1,2),然后将每个子物理端口作为单个端口。

pYYBAGNjkI2AfFkJAAIPdHFuWas538.png

图六 HDR二层胖树典型结构

HDR网卡

HDR的网卡相对交换机来说种类丰富很多。首先,在速率上有两种选择HDR100与HDR,其中HDR100网卡支持100G的传输速率,2个HDR100端口可通过200G to 2X100G线缆与HDR交换机互联。与100G EDR网卡不同,HDR100网卡的100G端口既支持4X25G NRZ传输,也支持2X50G PAM4传输。HDR网卡支持200G的传输速率,可直接使用200G直连线缆与交换机互联。除了有两种接口速率之外,每种速率的网卡可根据业务需求选择单口和双口以及PCIe的类型,纳多德提供的常用IB HDR网卡型号如下:

poYBAGNjkJGATMpxAARGnayfLTY048.png

表二 HDR网卡型号参数

InfiniBand网络架构简单,但方案选择却有多样,100G速率既有100G EDR方案,也有100G HDR方案;200速率也有HDR和200G NDR两种选择,不同的方案下使用到的网卡、连接件、交换机都有较大区别。

NADDOD作为NVIDIA Elite级别合作伙伴,可以根据不同客户的需求提供完整的InfiniBand解决方案。纳多德资深技术工程师拥有丰富的InfiniBand高性能网络方案设计与项目实施服务经验,可根据用户不同的应用场景,提供最优的QM8700/QM8790交换机+HDR网卡+AOC/DAC/光模块产品组合方案,实现超强性能和可扩展性,以更低的成本和出色的性能,为高性能计算 (HPC)、人工智能等应用提高投资回报率。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 交换机
    +关注

    关注

    21

    文章

    2621

    浏览量

    99216
  • 智能网卡
    +关注

    关注

    1

    文章

    52

    浏览量

    12225
收藏 人收藏

    评论

    相关推荐

    [分享]常见网络交换机故障及应用问答

    常见网络交换机故障及应用问答问:我的机器通过交换机和其他设备相连在同一网段,但是却ping不通,是哪些问题造成的? 答:有可能是硬件故障或是设置故障。若是硬件故障,应检查交换机的显示灯
    发表于 06-02 11:31

    InfiniBand 连接现在和未来

    可达到20Gbps,基于InfiniBand交换机的单端口带宽最大可达60Gbps,单交换机芯片可以支持达480Gbps的带宽,为目前和未来对于网络带宽要求非常苛刻的应用提供
    发表于 11-13 21:57

    华三S5820V2系列交换机的光模块解决方案

    华三S5820V2系列交换机定位于下一代数据中心及云计算网络中的高密接入,也可用于企业网或城域网。本文中将为您重点介绍华三(H3C)S5120-SI系列交换机及其的解决方案。华三S58
    发表于 01-20 10:12

    接入层交换机、汇聚层交换机和核心层交换机的区别

    出口,同样也做转发及选路。它必须能够处理来自接入层设备的所有通信量,并提供到核心层的上行链路。接入层交换机的功能是将终端用户连接到网络,因此接入层交换机具有低成本和高端口密度特性。2.性能
    发表于 06-04 11:57

    网络交换机

      交换机(Switch)就是一个延展装置,把原本的一个网线接口分成了多个。但是不同于传统意义上的集线器(Hub),交换机在将一个网络分成多个的情况下,并不会影响带宽和网速。由于交换机
    发表于 04-28 16:09

    网络交换机的应用类型

    网络交换机的应用类型 根据交换机所应用的网络层次,我们又可以将网络交换机划分为可分为企业级
    发表于 01-08 11:06 2616次阅读

    网络交换机的作用_网络交换机怎么用

    本文首先阐述了网络交换机的概念,其次阐述了网络交换机的作用,最后介绍了网络交换机的使用。
    发表于 04-02 08:49 6179次阅读

    交换机重要吗 如何使用NVIDIA交换机展现云计算、AI的性能

    交换机重要吗? 网络矩阵是现代化数据中心性能的关键。这对数据中心的交换机提出了很多要求,而其中最基本的要求,是为所有客户提供等量的带宽,以便均匀地共享资源。如果没有公平的
    的头像 发表于 10-20 09:54 2043次阅读

    NVIDIA发布新一代InfiniBand网络平台

    全新 400Gbps InfiniBand 交换机网络平台助力 AI、数据分析和高性能计算(HPC)应用实现安全、云原生、多租户和裸金属性能
    的头像 发表于 11-12 14:23 2465次阅读

    什么是网络交换机网络交换机的分类标准

    从广义上来看,网络交换机分为广域网交换机和局域网交换机。广域网交换机主要用于电信领域,提供基本的通信平台。局域网
    发表于 08-10 11:17 3182次阅读

    HPC网络的发展与RoCE的诞生

    新一点的Mellanox IB交换机QM8700系列HDR交换机的官方延迟数据是130ns,最新的QM9700系列NDR
    发表于 04-13 09:33 858次阅读

    核心交换机和普通交换机的区别?

    的区别,并探讨它们在网络架构中的不同作用。 首先,核心交换机网络中的主干设备,负责连接整个网络的各个子网和不同的网络节点。它通常具有更高的
    的头像 发表于 12-07 14:39 1623次阅读

    NVIDIA 发布全新交换机,全面优化万亿参数级 GPU 计算和 AI 基础设施

    NVIDIA 软件实现了跨  Blackwell GPU、新交换机和 BlueField-3 SuperNIC 的分布式计算,大幅提升了 AI、数据处理、高性能计算和云工作负载的性能
    发表于 03-19 10:05 311次阅读
    <b class='flag-5'>NVIDIA</b> 发布全新<b class='flag-5'>交换机</b>,全面优化万亿参数级 GPU 计算和 AI 基础设施

    深入探索InfiniBand网络HDR与IB技术

    InfiniBand和以太网之间的延迟对比可以分为两个主要组成部分。首先,在交换机层面上,以太网交换机网络传输模型中作为第2层设备运行,通常采用MAC表查找寻址和存储转发机制(某些产
    发表于 04-19 11:01 1486次阅读
    深入探索<b class='flag-5'>InfiniBand</b><b class='flag-5'>网络</b>、<b class='flag-5'>HDR</b>与IB技术

    兼容SiTime,国产高性能晶振/温补晶振交换机应用方案

    兼容SiTime,国产高性能晶振/温补晶振交换机应用方案
    的头像 发表于 08-30 09:55 231次阅读
    兼容SiTime,国产<b class='flag-5'>高性能</b>晶振/温补晶振<b class='flag-5'>交换机</b>应用<b class='flag-5'>方案</b>