0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

信而泰PFC/ECN流量测试方案:打造智能无损网络的关键利器

1092769615 来源:1092769615 作者:1092769615 2025-03-13 09:53 次阅读

导语:AI算力爆发的背后,如何保障网络“零丢包”?

在当今数据中心网络中,随着AI、高性能计算(HPC)和分布式存储等应用的飞速发展,网络的无损传输能力变得至关重要。PFC(基于优先级的流量控制)和ECN(显式拥塞通知)作为智能无损网络的关键技术,能够有效解决网络拥塞问题,保障数据传输的低延迟和高吞吐量。然而,如何验证和优化PFC/ECN技术的水线参数,提升无损网络的性能成为了网络设备制造商和运营商面临的重大挑战。

一、PFC/ECN技术简介

(一)PFC(Priority-based Flow Control)

PFC是基于IEEE 802.1Qbb标准的流量控制机制,通过为不同业务流量划分优先级,实现精细化拥塞管理。其核心逻辑如下:

优先级队列划分 :网络设备端口配置8个独立优先级队列(0-7),高优先级队列(如金融交易、AI训练流量)优先调度;

反压信号交互 :当接收端检测到某优先级队列拥塞时,向发送端发送PAUSE帧(反压信号),暂停对应队列的流量发送;

动态恢复机制 :拥塞解除后,接收端发送RESUME信号,恢复流量传输,确保高优先级业务零丢包。

典型应用场景

金融高频交易:微秒级时延敏感业务需绝对优先传输;

AI分布式训练:保障GPU间RDMA流量的无损交互;

实时视频流:避免关键帧丢失导致的画质劣化。

PFC机制在检测到网络拥塞时,会自动触发对低优先级流量的暂停,以保障高优先级流量的传输,而当拥塞缓解后,低优先级流量又会自动恢复传输,这一过程实现了网络流量的自动降速与恢复,有效平衡了不同优先级流量的传输需求。

如下图所示,DeviceA发送接口被分成了8个优先级队列,DeviceB接收接口则存在8个接收缓存,二者一一对应。DeviceB接收接口上某个接收缓存发生拥塞时,会发送一个反压信号“STOP”到DeviceA,DeviceA则停止发送对应优先级队列的流量。
image.png

PFC的工作方式

(二)ECN(Explicit Congestion Notification)

ECN是TCP/IP协议的扩展机制,用于减少网络拥塞导致的数据包丢失。当网络设备检测到拥塞时,会在IP数据包头部设置ECN标志,而不是直接丢弃。接收端收到标记后,会通知发送端降低传输速率,从而缓解网络拥塞。接收端收到RoCEv2 报文 IP ECN 标记为“11”,接收端口生成RoCEv2 CNP ,发给流量发送端。对指定QP可选择单个或者多个CNP 来对ECN 标记报文的响应。

ECN机制不仅提高了网络的利用率,还显著降低了丢包率。同时在拥塞缓解后,发送端又可以逐步提高发送速率,恢复正常的传输效率,实现了网络传输速率的动态调整与优化。
image.png

二、PFC/ECN流量测试的重要性

在数据中心网络中,PFC和ECN机制的有效性直接关系到网络的无损传输能力和整体性能。然而,在实际部署中,PFC/ECN机制可能面临以下问题:

优先级错配 :PFC队列映射错误导致高优先级流量被低优先级抢占;

阈值灵敏度不足 :ECN标记阈值设置不合理,引发拥塞响应滞后或过度降速;

多技术协同失效 :PFC与ECN策略冲突,导致网络性能波动。

测试价值
通过系统性验证PFC/ECN功能的有效性,优化水线参数配置,确保智能无损网络的稳定性和业务SLA达标。

三、PFC/ECN流量测试方案

(一)测试目标

  1. 验证PFC机制的有效性 :确保网络设备能够根据优先级正确地暂停和恢复流量,避免高优先级流量的丢包。
  2. 验证ECN机制的有效性 :确保网络设备能够在拥塞时正确地标记ECN标志,并通过CNP(拥塞通知报文)反馈机制调整发送速率。
  3. 评估网络在拥塞情况下的性能表现 :包括吞吐量、延迟和丢包率等关键指标。以及PFC与ECN自动降速功能对网络性能的影响

(二)测试环境

  1. 硬件设备

o RoCE网络测试仪、网络损伤仪

o 被测网络设备(如交换机、路由器)

  1. 网络拓扑

o 采用典型的Leaf-Spine架构,测试仪连接到Leaf交换机,被测设备部署在Spine层。

o 测试仪通过多个端口向被测设备发送PFC/ECN流量,模拟真实网络环境中的多源多宿场景。

o 在环境中部署损伤仪,模拟真实网络环境中的丢包、时延、抖动等场景
image.png

(三)测试方法

1. PFC测试方法

· 配置PFC优先级 :在测试仪和被测设备上配置相同的PFC优先级映射关系,确保测试流量能够触发PFC机制。

· 流量生成与发送 :测试仪生成具有不同优先级的流量,分别模拟高优先级和低优先级的业务流量。

· 拥塞触发 :通过调整流量负载,使被测设备的缓冲区接近满载,触发PFC机制。

· 流量监控与分析 :监控高优先级流量是否被正确暂停和恢复,低优先级流量是否能够正常传输,以及低优先级流量在PFC机制触发后的自动降速 情况和拥塞缓解后的恢复情况。记录流量的吞吐量、延迟和丢包率等指标。
配置RoCEv2 Server。配置VLAN Priority: 6,如下图所示:。
image.png
image.png

  1. PFC测试结果分析

o 检查高优先级流量是否在拥塞时被正确暂停,并在拥塞缓解后恢复传输。

o 分析低优先级流量的吞吐量和延迟变化,确保其不受PFC机制的影响。

o 评估网络设备在PFC机制下的整体性能表现,是否存在优先级调度失效等问题。

查看端口的Basic和PFC统计,可以看到端口1发出的流降速到28%。PFC统计正确,如下图所示:
image.png
image.png

配置RoCEv2 Server。配置VLAN Priority: 6,如下图所示:。
image.png

  1. ECN测试方法

· 配置ECN功能 :在测试仪和被测设备上启用ECN功能,并设置ECN标志位。

· 流量生成与发送 :测试仪生成带有ECN标志的流量,并向被测设备发送。

· 拥塞触发 :通过增加流量负载,使被测设备检测到拥塞,并在数据包头部标记ECN标志。

· CNP反馈机制测试 :接收端收到带有ECN标志的数据包后,生成CNP并发送给发送端。发送端根据CNP调整发送速率。

· 性能评估 :记录流量的吞吐量、延迟和丢包率等指标,评估ECN机制在拥塞控制中的有效性,以及自动降速功能对网络性能的影响。

配置端口参数,使能ECN,ECN配置成11(CE),如下图所示:
image.png

配置RoCEv2 Server。配置VLAN ID, IP地址信息,保证ARP可以成功,如下图所示:
image.png

配置QP流量,如下图所示:

image.png

  1. ECN测试结果分析

o 检查ECN标志是否被正确标记,并通过CNP反馈机制传递到发送端。

o 分析发送端是否根据CNP调整发送速率,以及调整后的吞吐量和延迟变化。

o 评估ECN机制在拥塞控制中的有效性,是否存在过度调整或调整不及时等问题。

查看端口统计和流统计的RoCEv2统计,如下图
image.png
image.png

四、DarYu-X系列测试仪智能无损网络的验证引擎

信而泰公司推出的X2-100G-12QSFP28、X5-400G高密度测试仪是一款专为高端路由器、交换机以及数据中心交换机设计的高密度测试平台。具备如下功能特性:
image.png

X2-100G RoCE测试板卡
image.png

高密度400G测试仪一体机

l 支持100G/200G/400G测试端口

l 支持L2(VLAN)和L3(DSCP)的QOS设置

l 支持RoCEv2流量的产生和发送

l 支持ECN/PFC使能和优先级设置

l 每端口支持8000个QP,支持基于QP选择流量端点

l 支持集合通信库CCL流量模型仿真

PFC/ECN流量测试是验证智能无损网络性能的关键手段。通过科学的测试方案,可以全面评估PFC和ECN机制的有效性,优化网络配置,提高网络的无损传输能力和整体性能。信而泰凭借其在测试领域的深厚积累,提供了全面的PFC/ECN流量测试解决方案,能够满足不同应用场景的需求。无论是AI训练、高性能计算还是分布式存储,信而泰的测试方案都能为网络设备制造商和运营商提供有力支持,助力智能无损网络的发展。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • PFC
    PFC
    +关注

    关注

    47

    文章

    1000

    浏览量

    106910
  • 分布式存储
    +关注

    关注

    4

    文章

    176

    浏览量

    19660
收藏 人收藏

    评论

    相关推荐

    5G网络中,测试仪如何帮助提升用户体验?

    在5G网络中,测试仪通过全面、深入地测试和分析令流程,为提升用户体验提供了有力支持。具体来说,
    发表于 03-21 14:33

    克示波器MDO32在高速信号测试中的关键作用与应用案例

    随着现代电子技术的飞速发展,高速信号测试在电子产品研发和生产中变得尤为重要。克示波器MDO32凭借其卓越的性能和丰富的功能,成为工程师们在高速信号测试中不可或缺的关键工具。本文将探讨
    的头像 发表于 03-21 13:18 73次阅读
    <b class='flag-5'>泰</b>克示波器MDO32在高速信号<b class='flag-5'>测试</b>中的<b class='flag-5'>关键</b>作用与应用案例

    5G网络优化中,测试仪如何帮助故障排查?

    在5G网络优化中,测试仪扮演着至关重要的角色,特别是在故障排查方面。以下详细分析测试仪如何帮助进行5G
    发表于 03-20 14:18

    无桥PFC变换器综述

    拓扑的发展历程进行了全面综述,并将无桥 PFC 变换器拓扑合成方案分为三大类,分别进行了详细介绍。最后,给出了无桥变换器拓扑的发展方向。 关键词:无桥 PFC 变换器;双极性增益;Bo
    发表于 03-13 13:50

    CCL仿真:解锁AI算力极限,智算中心网络性能跃升之道

    引言 随着AI大模型训练和推理需求的爆发式增长,智算中心网络的高效性与稳定性成为决定AI产业发展的核心要素。凭借自主研发的 CCL(集合通信库)评估工具 与 DarYu-X系列
    的头像 发表于 02-24 17:34 205次阅读
    <b class='flag-5'>信</b><b class='flag-5'>而</b><b class='flag-5'>泰</b>CCL仿真:解锁AI算力极限,智算中心<b class='flag-5'>网络</b>性能跃升之道

    网络测试仪校准解决方案

    、电线连接不良等因素会导致仪表工作状态不稳定; 人为因素:仪表在使用过程中安装方法不正确、测试配置错误、测试步骤不规范等因素影响测试结果准确性。
    发表于 01-13 15:29

    推出POE交换机一站式自动化测试方案

    方案背景 传统POE交换机测试工序主要有扫条码、接网线、POE供电测试流量测试、LED测试、信
    的头像 发表于 01-13 14:16 236次阅读
    <b class='flag-5'>信</b><b class='flag-5'>而</b><b class='flag-5'>泰</b>推出POE交换机一站式自动化<b class='flag-5'>测试</b><b class='flag-5'>方案</b>

    网络测试仪校准解决方案:精准测试,性能无忧

    影响仪表精度的因素 网络测试仪是用于对数据网络及其相关设备性能参数进行测试的仪表,可以模拟网络终端产生
    的头像 发表于 01-13 14:04 237次阅读
    <b class='flag-5'>信</b><b class='flag-5'>而</b><b class='flag-5'>泰</b><b class='flag-5'>网络</b><b class='flag-5'>测试</b>仪校准解决<b class='flag-5'>方案</b>:精准<b class='flag-5'>测试</b>,性能无忧

    虹科方案 仅需4个步骤!轻松高效搭建虹科TSN测试网络

    随着汽车行业向分层同构以太网网络的转型,时间敏感网络(TSN)逐渐成为实现确定性以太网互操作性的关键解决方案。本文将详细介绍如何快速搭建TSN测试
    的头像 发表于 01-06 11:32 283次阅读
    虹科<b class='flag-5'>方案</b> 仅需4个步骤!轻松高效搭建虹科TSN<b class='flag-5'>测试</b><b class='flag-5'>网络</b>

    慧能单相CrM PFC控制器系列产品解析

    慧能近日正式发布了最新的单相临界模式(CrM)PFC控制器HP101X系列产品,高效率,低功耗,紧凑封装,快来pick你的理想型方案
    的头像 发表于 11-30 15:15 576次阅读
    慧能<b class='flag-5'>泰</b>单相CrM <b class='flag-5'>PFC</b>控制器系列产品解析

    国产网络技术新飞跃:10G多速率光电组合TSN网络测试模块

    作为业界代表性的测试解决方案提供商,紧跟TSN技术发展。在Renix3.3.0版本推出10G多速率光电组合TSN
    的头像 发表于 08-29 16:38 562次阅读
    国产<b class='flag-5'>网络</b>技术新飞跃:<b class='flag-5'>信</b><b class='flag-5'>而</b><b class='flag-5'>泰</b>10G多速率光电组合TSN<b class='flag-5'>网络</b><b class='flag-5'>测试</b>模块

    消防管道压力流量监控方案

    方案,利用大数据、云计算等技术,以其智能感知与预警、数据分析与风险评估、远程监控与指挥调度等功能,为消防安全管理提供全方位、智能化的解决方案。通过实时监测消防管道的压力、
    的头像 发表于 07-30 17:05 434次阅读

    慧能双相交错CCM PFC芯片的优势解析

    Boost PFC变换器。这两款芯片的主要区别在集成度上,HP1013内置双路驱动,进一步的简化外围电路。对比前一代模拟方案,慧能HyCtrl两款芯片具有两大优势:灵活配置和智能化。
    的头像 发表于 07-25 11:24 2637次阅读
    慧能<b class='flag-5'>泰</b>双相交错CCM <b class='flag-5'>PFC</b>芯片的优势解析

    网络故障导致流量失控?看虹科Qci方案如何一招制胜!

    导读在当今快速发展的智能通讯领域,时间敏感网络(TSN)已成为确保网络通信高可靠性和低延迟的关键技术。IEEE802.1Qci作为TSN的一个重要组成部分,提供了一套强大的机制来管理
    的头像 发表于 06-20 08:04 689次阅读
    <b class='flag-5'>网络</b>故障导致<b class='flag-5'>流量</b>失控?看虹科Qci<b class='flag-5'>方案</b>如何一招制胜!

    上海电信携手华为打造400GE IP弹性无损智算广域网络

    中国电信上海公司(以下简称“上海电信”)在上海衡山花园酒店举办的“智云上海发布暨2024中国电信上海公司科技节”上,携手华为展示400GE IP弹性无损智算广域网络创新解决方案
    的头像 发表于 05-21 09:55 1353次阅读
    上海电信携手华为<b class='flag-5'>打造</b>400GE IP弹性<b class='flag-5'>无损</b>智算广域<b class='flag-5'>网络</b>