0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据中心超融合以太网技术解析

架构师技术联盟 来源:架构师技术联盟 2023-09-11 14:55 次阅读

AI集群训练过程中,参数通过高速互联网络在不同的服务器间进行同步交互,这些通信流量具有共同的特征:流量成周期性、流数量少、流量长连接、并行任务间有强实时同步性要求,通信效率取决于最慢的节点,并且AI集群训练场景下,传输的数据量较大。上述的流量特征导致网络较易出现负载分担不均、整网吞吐下降的问题,从而影响AI集群训练的性能。

当前网络均衡的主流技术有三种,逐流(Flow-based)ECMP均衡、基于子流flowlet均衡和逐包(Packet-based)ECMP均衡。逐流ECMP均衡,是当前最为常用的负载均衡算法,基于流量的五元组进行HASH负载均衡,在流链接数量较多的场景下适用,它优势在于无乱序,劣势在于流数量较少时,例如AI训练场景下,存在HASH冲突问题,网络均衡效果不佳。基于子流flowlet均衡技术,它依赖于子流之间时间间隔GAP值的正确配置来实现均衡,但由于网路中全局路径级时延信息不可知,因此GAP值无法准确配置。同时,该技术存在接收端侧乱序的问题。逐包(Packet-based)ECMP均衡,理论上均衡度最好,但实际在接收端侧存在大量乱序问题,现实中几乎无使用案例。

现有创新的网络均衡技术NSLB是面向AI训练场景量身打造的,根据该场景下的流量特征,将搜集到的整网信息作为创新算路算法的输入,从而得到最优的流量转发路径,实现AI训练场景下整网流量100%的均衡度和AI训练性能的提升。

利用12台GPU服务器(每台服务器包含1块型号为Tesla v100S PCIe 32GB的GPU卡),4台华为交换机组成2级CLOS网络(其中2台交换机作为接入层交换机,每台下挂6台服务器,使用100GE单端口接入,2台交换机作为汇聚交换机,每台与接入层交换机之间使用6个100GE端口互联)的AI训练集群,运行开源Tensorflow深度学习平台上的VGG16深度学习网络模型。以下为采用NSLB技术运行单计算任务和多计算任务时,AI训练性能的提升结果。

22147cfa-4ebe-11ee-a25d-92fbcf53809c.png

Ring算法场景,运行单个计算任务下,使用NSLB技术对比典型ECMP负载分担技术,AI训练集性能最高提升113.41%。

2234cadc-4ebe-11ee-a25d-92fbcf53809c.png

Ring算法场景,运行两个计算任务下,使用NSLB技术对比典型ECMP负载分担技术,AI训练集性能最高提升57.29%。

高性能计算、AI模型训练等应用场景,以及数据中心网络/云网络在架构上的发展(资源池化),均要求网络传输排队时延和吞吐上的进一步性能提升。例如,为了保证性能损失在5%以内,数据库集群系统要求至少40Gbps的吞吐和3us的网络RTT。为了达到极低时延的传输,应当尽力降低网络设备上的排队时延,同时维持接近瓶颈链路满吞吐。

随着业务发放速度的不断加快,以及引入了VM、容器等虚拟化技术,网络流量的不确定性增加。而当前运维手段有限,仍然依靠传统网管和命令行方式进行查看、监控,分钟级的网络监控已经无法满足业务秒级体验保障的要求,往往被动感知故障。故障发生后,定位仍主要依赖专家经验,利用多种辅助工具,逐段定界、逐流分析、抓包定位,效率十分低下。

为了解决上述故障收敛慢的问题,提出了一种基于网络设备数据面的链路故障快速自愈技术,称为DPFF(Data Plane Fast Failover)。该技术基于转发芯片硬件编程能力构建。DPFF从传统的基于控制面软件协议的收敛方式演进到基于数据面硬件极速感知故障和快速换路的收敛方式,并且基于数据面硬件实现远程通告和快速换路,可达到亚毫秒级(<1ms)的收敛速度,将对业务性能的影响降至最低。该技术为高性能数据库、存储以及超算等关键应用提供了极致的高可靠性保证和稳定性体验。

实验室采用4台华为交换机组成2级CLOS网络(其中2台交换机作为接入层交换机,每台下挂>2台服务器,2台交换机作为汇聚交换机),利用vdbench 测试套件,客户端服务器与存储阵列建立两个连接,每连接8个qp,并发访问8个SSD磁盘。通过拔光纤模拟链路故障。256KB message size,16 threads,write IO , 观察链路故障发送后的IOPS指标。

2277367e-4ebe-11ee-a25d-92fbcf53809c.png

测试结论:DPFF方案下链路故障对IOPS性能几乎没有影响,而OSPF协议收敛方案下IOPS出现多秒跌零情况。

利用Benchmarksql测试套件进行在线事务处理模型的测试,又称TPC-C测试。统计每百毫秒周期内完成的在线事务的数量,通过查看该数量值的变化测试收敛性能对业务性能的影响。模拟链路故障,重复测试4次, 观察在线交易事务受影响情况。

2292d88e-4ebe-11ee-a25d-92fbcf53809c.png

测试结论:DPFF收敛方案比传统的OSPF收敛方案在链路故障下,每100ms周期内完成交易事务数量下降减少60%~80%。

计算集群网络传统采用CLOS架构,以业界常见的64口盒式交换机为例,3级CLOS架构,最大可支持6.5万服务器接口,不满足10E级计算集群规模诉求。如果增加网络层数则会带来网络跳数增加,通信时延不满足业务需求。

业界针对该问题开展了多样的架构研究和新拓扑的设计。直连拓扑在超大规模组网场景下,因为网络直径短,具备低成本、端到端通信跳数少的特点。以64口盒式交换机构建10万个节点超大规模集群为例,传统的CLOS架构需要部署4层组网,端到端通信最大需要跨7跳交换机。使用无阻塞直连拓扑组网,端到端交换机转发跳数最少只3跳,交换机台数(整体投资)下降40%。

22c4abfc-4ebe-11ee-a25d-92fbcf53809c.png

采用12台GPU服务器,每台服务器2块GPU卡,型号Tesla v100s;2块CX6-Dx网卡,网卡是100G单端口接入。OSU MPI Benchmark测试AllReduce集合通信操作,DF相对FT组网,任务完成时间最高提升39.47%,总体提升21.63%。

22f267fe-4ebe-11ee-a25d-92fbcf53809c.png

OSU MPI Benchmark测试Alltoall集合通信操作, DF相对FT组网,任务完成时间最高提升56.53%,总体提升49.71%。

2313d056-4ebe-11ee-a25d-92fbcf53809c.png

随着高性能网络的全以太化发展,超融合以太网络同时承载计算、存储、管理和虚拟化等多种业务流量。为了追求更极致的性能,不同业务流量之间,极易出现互相干扰现象,竞争网络侧有限的端口转发资源。

为了解决这个难题,提出超融合智能无损网络方案,将业务级SLA智能保障技术引入到交换机中,用iLoss-less智能无损算法代替专家经验,对网络流量的变化进行基于队列级捕获和预测,实现细粒度动态差异化优化。结合不同业务的流量变化情况以及业务特征,实现不同业务流量差异化动态优化保障。

23355000-4ebe-11ee-a25d-92fbcf53809c.png

2363a590-4ebe-11ee-a25d-92fbcf53809c.png

根据实验室测试,采用3台华为交换机组成2级Spine-Leaf组网,每台接入层交换机下挂16台100GE服务器,Spine与每个Leaf之间采用4个400G互联(1:1收敛)。在计算和存储benchmark流量混跑的测试环境下,智能无损算法相比于传统算法配置,在保持存储持平前提下,能够有效降低计算任务的总体完成时间,在测试场景中实现最高20%以上的计算时延降低。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 负载
    +关注

    关注

    2

    文章

    551

    浏览量

    34184
  • 服务器
    +关注

    关注

    12

    文章

    8823

    浏览量

    84903
  • 数据中心
    +关注

    关注

    16

    文章

    4564

    浏览量

    71779
  • AI
    AI
    +关注

    关注

    87

    文章

    29301

    浏览量

    267538
  • 均衡技术
    +关注

    关注

    0

    文章

    11

    浏览量

    6646

原文标题:数据中心超融合以太技术(2023)

文章出处:【微信号:架构师技术联盟,微信公众号:架构师技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    以太网交换机将在数据中心领域加速增长

    近几年,随着(移动)互联网、云计算和大数据产业的加速发展,进一步推动了数据中心的建设步伐。据Dell‘Oro集团最新调查报告显示,2019年,数据中心以太网交换机市场预计将
    发表于 08-05 07:47 672次阅读

    以太网技术基本原理

    Xeros公司开发的一种基带局域网技术,使用同轴电缆作为网络媒体,采用载波多路访问和碰撞检测(CSMA/CD)机制,数据传输速率达到10Mbps。虽然以太网是由Xeros公司早在70年代最先研制成功,但是如今
    发表于 12-03 19:07

    探讨工业以太网技术(一)

    所谓工业以太网就是在以太网技术和TCP/IP技术的基础上开发出来的一种现场总线。作为现场总线的工业以太网与一般的商用以太网有很大不同。 必须
    发表于 12-15 14:28

    探讨工业以太网技术~(二)

    所谓工业以太网就是在以太网技术和TCP/IP技术的基础上开发出来的一种现场总线。作为现场总线的工业以太网与一般的商用以太网有很大不同。 必须
    发表于 12-15 14:29

    网络发展怎么改变企业数据中心的面貌的

    云和网络规模提供商已经实施了软件定义存储、融合架构和融合架构。以太网存储结构(ESF)技术已经成为数据
    发表于 08-16 15:08

    以太网技术基本原理

    以太网技术基本原理 通常我们所说的以太网主要是指以下三种不同的局域网技术:  
    发表于 07-24 08:10 5320次阅读
    <b class='flag-5'>以太网技术</b>基本原理

    更好的以太网打造更现代的数据中心

    以太网正在随着数据中心不断发展,有时这意味着增量改进,而不是巨大的飞跃。在数据中心网络基础设施的变革中,值得注意的是,传统网络技术需要应付瞬息万变的世界,而解决方案并不总是更多的带宽和
    发表于 01-22 14:43 740次阅读

    融合数据中心网络简介

    现如今,数据中心正成为算力中心,为千行百业提供数字化底座,并基于海量数据挖掘其中的商业价值。同时,在数据中心云化升级、全闪存化等变革之下,全以太
    的头像 发表于 10-19 15:17 2440次阅读
    <b class='flag-5'>超</b><b class='flag-5'>融合数据中心</b>网络简介

    转载|数据中心网络持续进阶,融合以太技术正当其时

    随着数字经济进入“算力时代”,在算力蓬勃发展的同时,打造一张与时俱进的高水平数据中心网络显得尤为重要。近日,华为联合中国信息通信研究院共同发布的数据中心融合
    的头像 发表于 12-16 19:15 723次阅读

    融合数据中心网络架构的典型特征与价值

    结合业界在融合数据中心网络技术中的实践与探索,对融合数据中心网络架构的未来发展进行了展望。数据中心
    的头像 发表于 12-19 10:53 1594次阅读

    企业数据中心融合的现实

    电子发烧友网站提供《企业数据中心融合的现实.pdf》资料免费下载
    发表于 08-28 09:34 0次下载
    企业<b class='flag-5'>数据中心</b><b class='flag-5'>超</b><b class='flag-5'>融合</b>的现实

    HPC和数据中心融合网络面临的技术挑战

    随着大型DC采用具有更高带宽需求的高性能加速器,数据中心网络通过支持远程直接内存访问(RDMA)、RDMA融合以太网(RDMA over converged Ethernet,RoCE)、互联网广域RDMA协议(iWarp)等新
    发表于 09-15 09:56 768次阅读
    HPC和<b class='flag-5'>数据中心</b><b class='flag-5'>融合</b>网络面临的<b class='flag-5'>技术</b>挑战

    单对以太网技术的介绍 单对以太网技术的优势 单对以太网技术的应用

    单对以太网技术的介绍 单对以太网技术的优势 单对以太网技术的应用  以太网技术是一种局域网传输协议,通常用于连接局域网内的多台计算机和网络设备。它是最常用的局域
    的头像 发表于 11-28 15:45 665次阅读

    祝贺!《融合以太网络总体技术要求》行业标准立项成功

    数据中心存在通用计算、存储、算和AI智算多种业务场景,传统数据中心网络使用不同的网络技术承载不同业务,如存储使用FC网络,算使用IB网络
    的头像 发表于 11-28 19:05 485次阅读

    数据中心市场的关键以太网解决方案

    了解数据中心市场动态的关键在于以太网解决方案。Synopsys负责产品管理和高性能计算IP的副总裁Michael Posner说:“以太网数据中心中根深蒂固……虽然它并不广为人知,但
    发表于 03-12 09:53 329次阅读
    <b class='flag-5'>数据中心</b>市场的关键<b class='flag-5'>以太网</b>解决方案