0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ZXUN xGW边缘UPF BGP闪断的问题处理

中兴文档 来源:中兴文档 2024-12-23 15:02 次阅读

故障现象

某运营商反馈在定制网业务中,UPF为BM CAAS形态,UPF业务交换机为MCLAG组网。业务配置完成不久后出现两个告警:

1. UPF Rosng协议栈xgei-2/0/4/2.7频繁出现BFD会话闪断现象。

2. 第二台UPF业务交换机的BGP Loopback地址(192.168.100.18/FD00100:: 18)到UPF Rosng协议栈的BGP出现闪断。

因此需要排查原因。

故障分析

面对此类问题,需要从故障现象中归纳总结几个关键点:

一、由“业务配置完成后不久出现两个告警”可以得出,告警大概率与现场新加的定制网业务配置有强相关。

二、出现的告警为Rosng与UPF业务交换机,可进一步缩小定界范围。

因此排查过程如下:

1. 分析UPF告警:通过EM告警采集,可以看到存在“BFD会话down”告警,且告警特征为告警发生频繁、可自动恢复,Rosng端口为xgei-2/0/X/2.7,如下图所示。

f01c4d2c-bf37-11ef-9310-92fbcf53809c.png

2. 此外,还存在“BGP邻居down”告警,告警可自动恢复,故障IP=192.168.100.18,如下图所示。

f0258f0e-bf37-11ef-9310-92fbcf53809c.png

3. 根据以上告警信息检查UPF网元业务配置,发现IP=192.168.100.18地址为UPF的N6侧BGP邻居地址(邻居为业务交换机),如下图所示。

f03fcedc-bf37-11ef-9310-92fbcf53809c.png

4. UPF告警所在的Rosng端口均为VPN为yghjb的端口,此VPN也是本次定制网新添加配置。VLAN ID为1061,VLAN网关在UPF业务交换机,因此在Rosng进行Ping测试,目的IP为VLAN1061网关,源地址取Rosng逻辑接口地址(192.168.30.1~4)。但Ping测试结果显示均能Ping通(告警同时未复现);Rosng和交换机侧VLAN1061相关的ND6 Cache结果均为正常,如下图所示。

f04b02de-bf37-11ef-9310-92fbcf53809c.png

5. 检查两台UPF业务交换机配置,发现两台业务交换机未配置anycast mac地址,如下图所示。

f05ca5a2-bf37-11ef-9310-92fbcf53809c.png

6. 在交换机为MCLAG组网中,若VLAN网关的anycast mac不配置,将会导致NA单播报文无法命中三层mac,NA上送失败后,交换机的MAC地址学习异常。

当Rosng模块接口IP无法学习到VLAN1061网关时,将导致VLAN1061链路不通,而VLAN1061链路不通将会使Rosng所有以VLAN1061为BFD检测的路由进行失效处理,配置如下图所示。

f06cf290-bf37-11ef-9310-92fbcf53809c.png

当此默认路由失效使,Rosng与业务交换机的BGP邻居则不通,这也解释了产生“BGP邻居down”告警的原因。

故障处理

1. 在UPF两台业务交换机的VLAN1061网关,执行如下命令:

interface mac-address 0000.5e00.2101 anycast

2. 命令执行成功后,BFD会话down的闪断告警便不再出现,问题解决。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 运营商
    +关注

    关注

    4

    文章

    2398

    浏览量

    44506
  • 交换机
    +关注

    关注

    21

    文章

    2646

    浏览量

    99813
  • UPF
    UPF
    +关注

    关注

    0

    文章

    50

    浏览量

    13540

原文标题:ZXUN xGW-边缘UPF BGP闪断的问题处理

文章出处:【微信号:ztedoc,微信公众号:中兴文档】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    bgp配置实例讲解 如何配置Cilium和BGP协同工作

      背景 官方提供了多篇文档说明如何配置 Cilium 和 BGP 协同工作,本文主要对以下部分功能进行验证: Using BIRD to run BGP[1] Using kube-router
    的头像 发表于 08-15 09:15 2118次阅读
    <b class='flag-5'>bgp</b>配置实例讲解 如何配置Cilium和<b class='flag-5'>BGP</b>协同工作

    测量BGP传递时间

    测量BGP传递时间
    发表于 07-22 08:46

    测量BGP传递时间

    测量BGP传递时间
    发表于 07-22 10:06

    什么是UPF呢?

    Synopsys推荐的UPF及Power Domain流程简介上次介绍了在当前先进制程下低功耗设计实现都需要UPF技术的支持,否则在功耗验证的时候将会很难验证并且对后续的综合和后端实现也带来了很大
    发表于 07-28 06:15

    什么是UPF功率域和域边界?

    什么是UPF功率域和域边界?
    发表于 09-29 06:08

    什么是低功耗UPF

    什么是低功耗UPF
    发表于 09-29 07:49

    UPF流程与电源域Power Domain详解

    UPF流程是怎样的?怎样使用UPF0对RTL进行动态/静态功耗验证?什么是电源域Power Domain?如何对电源域Power Domain进行划分?
    发表于 10-20 07:32

    动态BGP与静态BGP的区别

    时,会导致某个运营商方向不能正常通信。造成单点故障,影响范围是 某个运营商出口分方向,造成部分用户无法正常通信,故障的修复责需要人为干预处理,不能自动修复,处理时间一般较长。 2.动态BGP,路由发布
    发表于 12-01 16:55

    什么是BGP高防,BGP高防的优势是什么

    什么是BGP高防?BGP全称是Border Gateway Protocol,即边界网关协议,是用来连接Internet上的独立系统的路由选择协议。
    发表于 12-28 11:22 1091次阅读

    动态BGP是什么,如何判定它的真假

    一、什么叫动态BGP: 中国电信 、中国联通、中国移动和一些拥有AS自治域的大型民营IDC运营商可以通过BGP协议来实现多线互联,这个唯一能够妥善处理不相关路由域间的多路连接的边界网关协议,是运行于
    发表于 04-18 09:47 1248次阅读

    ZXUN MEC-L型UPF纳管异厂家服务器失败的解决办法

    某运营商L型UPF纳管异厂家服务器,服务器型号为超聚变2288H V5。
    的头像 发表于 04-04 09:11 1117次阅读

    ZXUN xGW-ToB业务延迟的问题处理

    梳理所有转发路径上可以抓包的点,进行一次抓包测试,目的是在故障复现期间明确各个转发节点的处理报文情况,用于初步分析页面卡顿是丢包还是时延导致。
    的头像 发表于 04-04 09:49 679次阅读

    什么是低功耗设计呢(UPF编码篇)

    UPF编码基础(内容:电源网络定义,多电压域设计,低功耗模式,低功耗单元规则(rules),芯片边缘供电定义,IP供电描述)
    发表于 05-15 14:22 1686次阅读
    什么是低功耗设计呢(<b class='flag-5'>UPF</b>编码篇)

    R5300 G4服务器网卡频繁的故障处理方法

    本节描述R5300 G4服务器网卡频繁的故障处理方法。
    的头像 发表于 09-25 10:18 1157次阅读
    R5300 G4服务器网卡频繁<b class='flag-5'>闪</b><b class='flag-5'>断</b>的故障<b class='flag-5'>处理</b>方法

    ZXUN xGW-UPF双域容灾局点互转隧道异常的问题处理方法

    双域容灾组网场景,用户接入后在主用UPF建立会话,长Ping内网地址可Ping通。执行中断双域主用UPF脚本文件,长Ping中断。
    的头像 发表于 10-16 09:37 753次阅读
    <b class='flag-5'>ZXUN</b> <b class='flag-5'>xGW-UPF</b>双域容灾局点互转隧道异常的问题<b class='flag-5'>处理</b>方法