0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

广东电信发生历史性故障,波及全省电信用户,容灾机制不起作用?

Felix分析 来源:电子发烧友网 作者:吴子鹏 2023-06-10 00:11 次阅读

电子发烧友网报道(文/吴子鹏)6月8日,广东电信发生重大故障,导致广东电信全省本地及漫游用户通话异常。当天16时左右,陆续有网友在社交媒体上发文指出,使用电信卡的手机无法通话和通信。“故障发生后,自己尝试了拔卡重启、检查手机硬件、充话费等不同方法,依然无法解决问题。”

随后不久,中国电信广东客服回应称,“因网络异常,影响部分移动用户接听电话,我们正在进行抢修,由此给您带来的不便,我们深表歉意,感谢您的理解和支持。”而后在8日18时左右,中国电信广东客服又补充发文表示,“经紧急抢修,自16:30起,受影响的用户正逐步恢复,对在此期间受到影响的客户表示真诚的歉意。”

到了19时左右,此官微又发布了一条消息称,“截至目前,受影响的移动用户接听语音业务已全面恢复,给您带来的不便我们再次深表歉意。”

wKgaomSC-v2AOkPXAAGc2MttXkA970.png
图源:中国电信广东客服官微


对于此次故障的具体原因,中国电信官方还没有公布。不过,针对这起历史性的电信事故,8日晚,广东省通信管理局召集广东电信、广东移动、广东联通、广东广电、广东铁塔相关负责人召开网络运行安全紧急调度会。

跳出事件本身来看,电信系统到底是如何运营的呢?容灾系统不起作用原因有哪些呢?


解密电信网络系统

对于电信网络的运转,其上方有两套系统,分别是上层IT软件和底层基础硬件

其中IT系统又可以分为BSS、OSS、MSS和EDW。BSS(Business Support System,业务支撑系统)和OSS(Operation Support System,运营支撑系统)合称为BOSS系统,也就是电信业务运营支撑系统。BOSS系统以客户服务、业务运营和管理为核心,支持客户服务和计费等关键事物的运转。

在BOSS系统中,BSS实际上是具有主动式管理能力的。这种能力让运维人员在故障发生之前就能够提前介入处理,消除系统故障带来的潜在风险,是运营商系统层面提升客户满意度的关键功能。不过很显然,在此次广东电信故障事故中,BSS系统并没能起到主动式管理的作用,从这个层面来看,这次的事故突发性很强。

MSS(Management Supporting System,管理支撑系统)负责IT系统的规划和窗口展现,帮助电信运营商实现业务和市场需求更好地结合,并提升企业管理和IT系统升级的效率,也对企业运营效率提升有帮助。

EDW(Enterprise Data Warehouse,企业数据仓库)主要负责数据存储和信息化管理。

IT系统是电信运营商业务的神经枢纽,当然其运转还需要部署在底层的硬件设备上。在介绍底层硬件结构之前,我们先结合下图看一下电信业务是如何运转的。如下图所示,无论是电话业务,还是移动手机业务,最终都需要连接到核心网。

wKgZomSC-0WAKTCAAADAlNCv1Ew772.png
电信业务服务架构示意图,图源:华为培训


再看一下另一张图,宽带业务实际上也是如此,全部业务支撑最终都要回归到核心网层面。

wKgaomSC-1-AAC6fAACTiq1CfBA829.jpg
宽带业务示意图,图源:华为培训


所以,这就是为什么运营商很多时候被称为“管道商”。实际上,所有的电信运营业务都像是水管一样,网络流量由核心网分化而来,每一项业务都是基于管道里的流量,从骨干网分流,如下图所示。

wKgZomSC-2qAADijAAQloGJlo1o863.png
电信网络分流示意图,图源:中国电信


当然,网络是一个相对虚化的概念,具体还是要靠设备来支撑。在整个网络架构中,三种设备最为常见和关键,分别是路由器、交换机和核心交换机。如下图所示,无论网络在核心网、IP传输网还是业务网上传输,依靠的都是交换机来中转。

wKgaomSC-3aAEo_JAAlLlihg17Q604.png
图源:广州移动培训资料


运营商在建设网络时,一般会选择使用多台核心交换器来构建超级节点,超级节点基本只存在北上广等重要节点城市部署,负责国际和省际之间的网络传输,也构成了核心网传输的第一平面。这个平面包括超级节点及其链路,以及各省第一出口链路。当然,骨干网络还有第二层,由普通核心节点到超级节点的链路和各省第二出口链路组成,负责跨大区域间的流量转发,大约全国2/3的流量都在这个网络上跑。如下图所示,为了增加网络接入的效率,在节点上将流量进一步分流,也就到了基站和普通交换机/路由器一端,方便用户的接入。

wKgaomSC-7KATgerAASklQxDEfo455.png
网络接入和传输示意图,图源:华为培训


那么,很显然一个普通的路由器和交换机是很难让一个省的网络全部出现问题的,很可能就是核心交换机出现了问题,影响骨干网的传输,导致一个省没有网络流量入口。

虽然二层网络已经推出很多年,不过目前依然是电信运营商主要采用的骨干网架构。虽然二层网络的扩展性不好,不过其跨域传输的性能很出色。当然,这也造成了一个问题,那就是看似互联互通的网络,会存在一些重要的节点,这些节点是不容有失的。

电信网络的容灾机制

电信网络是一个关系到国计民生的领域,因此在构建的过程中,是需要具有容灾机制的,面对一些突发的挑战。

我们上面已经提到,电信网络基本靠两套系统在运作,一个是IT系统,另外一个是底层设备。由于用户信息和业务高度集中,因此每一个电信业务开始部署时都有一套“plan B”,也被称为容灾措施,主要是为了应对突发的火灾、洪水、飓风和其他突发因素等。

据介绍,除了在BSS系统中加入故障预判的机制以外,电信系统在硬件层面具有多层容灾措施,包括单板主备容灾、设备主备容灾、网元主备容灾、同城异域容灾以及异城异地容灾。通过多维度丰富的容灾措施,一般在重大故障之后,电信运营商都能够很快地恢复网络。

上一次发生地域性大规模断网是在郑州大洪水期间。由于数十年难得一见的洪水,导致郑州骨干核心机房和主备机房全部被水淹。最终,为了让郑州市民能够尽快使用网络,启动了异城异地的容灾机制。

不过,一般而言,异城异地容灾已经是最高规格的电信网络容灾机制了,一旦遇到全省范围内的突发事件,实际上也很难起到作用。

写在最后

此次广东电信的故障是一次历史性的事件,也给国内的主要运营商提了醒。在当前的骨干网络架构里,一些关键节点的重要性与日俱增,一旦出现问题,就会带来大面积的影响。当然,此次广东电信故障还没有公布真正的原因,上述也只是从电信运营商软硬件体系结构下推断出来的。具体原因如何,相信广东电信会给大家一个解释。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 电信
    +关注

    关注

    2

    文章

    725

    浏览量

    61881
收藏 人收藏

    评论

    相关推荐

    广东电信与华为发布“云网预知”联合创新系统

    近日,中国电信广东公司(以下简称“广东电信”)联合华为举行“云网预知”联合创新系统上线仪式暨L4自动驾驶网络联合创新启动会,标志着双方在IP自智网络领域的合作迈上新的台阶。双方将共同努力,深入探索网络创新,稳步推动IP网络向高阶
    的头像 发表于 11-18 11:33 236次阅读

    使用ADS1299进行脑电信号采集时采集不到脑电信号,怎么解决?

    您好!我这边在使用ADS1299进行脑电信号采集时采集不到脑电信号,用信号发生器进行测试,能采集到0.5uV左右的正弦波,文档中是该芯片的原理图和电极连接方式说明,请问是否有问题?还麻烦指教,谢谢!
    发表于 11-13 06:52

    TPA3112D1为什么不起作用了?

    您好,我有一块TPA3112D1模块之前用着一直是好的,但是突然就不起作用了,我想知道友们有办法测试一下我的芯片是好是坏,是否工作正常??谢谢
    发表于 09-06 07:45

    秒送LBS场景下的C端SOA服务建设之-数据备份篇

    ,采用主从复制和异地多活架构,可以确保在某个数据中心发生故障时,其他数据中心能够迅速接管业务,避免服务中断。此外,定期进行灾难恢复演练和系统压力测试,也是提高能力的关键措施。通过这
    的头像 发表于 08-15 14:24 265次阅读
    秒送LBS场景下的C端SOA服务<b class='flag-5'>容</b><b class='flag-5'>灾</b>建设之-数据备份篇

    ADAYO华阳再获广东省电子信息制造业奖项

    子公司华阳多媒体分别上榜《2024年广东省电子信息制造业综合实力百强企业榜单》、《2024年广东省电子信息制造业高成长创新企业名单》。 关于广东电子信息制造业综合实力百强企业 广东电子
    的头像 发表于 07-23 09:10 678次阅读

    AT CWHOSTNAME不起作用的原因?

    我想更改主机名,但在命令 AT CWHOSTNAME 不起作用。 我尝试过 AT CWMODE_CUR=1 或 AT CWMODE_CUR=3,但我得到了相同的结果。 PS
    发表于 07-15 06:09

    Fx3 an65974 stream_in示例不起作用是怎么回事?

    我有一个 CYUSB3KIT-003,我想使用来自 an65974 的示例,但是 sf_streamIN 示例不起作用,我不知道如何修复它。 我的 fx3 与 altera cyclone v 系列
    发表于 07-04 07:28

    世界电信日之你知道吗?

    而设立的。1865年5月17日,国际电信联盟正式成立,为了纪念这一历史性的日子,自1969年起,每年的5月17日被定为世界电信日。在2006年11月举行的国际电信
    的头像 发表于 05-19 08:05 112次阅读
    世界<b class='flag-5'>电信</b>日之你知道吗?

    广东电信携手华为斩获“2023年度SDN、NFV、网络AI最佳实践案例”

    在北京举办的2024年云网智联大会上,广东电信与华为联手打造的《基于数字孪生技术打造云网预知系统实现网络配置变更在线仿真与精准评估》项目,一举斩获“2023年度SDN、NFV、网络AI最佳实践案例”。
    的头像 发表于 04-14 10:23 776次阅读
    <b class='flag-5'>广东电信</b>携手华为斩获“2023年度SDN、NFV、网络AI最佳实践案例”

    stm32cubemx的功能不起作用是哪里的问题?

    最近几个版本的stm32cubemx的功能不起作用: 在cube上有一个很好用的功能就是点按ctrl和click按键会让alternative pin显示出来,这个功能非常高效率。然而不知道是java的问题还是新版本的问题,目前的按键不起作用
    发表于 04-08 07:28

    用中断测试了CAN EVAL_BDPS_DRIVER,中断不起作用的原因?

    我用中断测试了 CAN EVAL_BDPS_DRIVER 。 但中断不起作用。 根据我对配置文件所做的更改。 但EVAL_IM_FLEX_ADAPTER_V1未获得正确的输出。 请帮我解决这个问题。
    发表于 03-06 07:44

    TC387不起作用的原因?

    我使用的是 TC387。当我使用 Trace32 下载 *.elf 文件时,它运行良好。但是我使用 Trace32 下载了*.hex 文件,但它不起作用。即使我使用 Trace32 下载 *.elf
    发表于 02-27 08:02

    工业交换机在电信行业的关键作用与应用需求

    工业交换机是电信行业中的关键设备,在现代社会中扮演着连接和传输数据的重要角色。本文将探讨工业交换机在电信行业中的作用和不断增长的需求,帮助用户了解其在
    的头像 发表于 01-31 09:32 604次阅读

    TC377的EVADC配置,硬件触发器不起作用的原因?

    我正在研究 TC377 的 EVADC 配置,我的频道上有硬件触发器 g0ch6-ATOM1_5(不起作用 ) g0ch 7-与 g2ch7 G1ch1-同步 G1ch1-ATOM1_ 4
    发表于 01-25 07:50

    codeblocks点击run不起作用

    对于Code::Blocks点击Run无法起作用的问题,有以下几个可能的原因和解决方法: 编译器问题:Code::Blocks使用的是GNU编译器,可能出现了某些编译器设置方面的问题。可以尝试
    的头像 发表于 11-26 09:30 4360次阅读