2020年9月23日,以“共创行业新价值”为主题的华为全联接2020在上海隆重举办。25日在大会媒体圆桌现场,华为正式发布了《华为网络人工智能引擎 iMaster NAIE 白皮书》,使能自动驾驶网络。自2019年4月上线华为云以来,iMaster NAIE 网络人工智能引擎(简称NAIE)在电信行业得到了丰富的实践机会,此次白皮书的发布,是华为在网络全云化基础上将AI 技术引入到电信网络中的一次实力展示,也是华为帮助电信领域提升网络效率,降低运营成本,向自动驾驶网络演进过程中迈下的扎实一步。
运营商AI特性规模应用挑战重重
在本次发布的白皮书中,有一部分内容引起了电信运营商的特别关注,那就是华为云地协同解决方案,它解决了AI应用在规模复制过程中碰到的关键问题。
众所周知,电信行业一直是AI应用的前沿阵地。实践也证明了,AI技术在运维效率、能耗效率、网络资源利用率以及用户业务体验提升等方面确实能够带来明显价值。但在电信行业智能化升级过程中,网络 AI 的规模化工程应用仍然存在很多挑战,例如模型泛化能力差、模型重训练占用资源多、模型版本升级管理难度大、本地样本少并且模型精度不够等问题。
以AI模型版本升级管理为例,很多场景的AI模型都是一站一模型,例如无线流量预测、无线基站智能节能等场景,各站点的模型都根据本地化数据进行定制化训练。但由于各局点模型版本不同,升级频度也不同,成千上万的站点模型导致管理难度很大。电信运营商迫切需要有一个统一的平台,高效实现模型状态的监控和版本升级策略等管理任务。
在站点模型数量众多的同时,部分场景又面临着样本量太少不足以支撑模型训练的问题。例如核心网KPI异常检测,单局点发生异常频率很少,训练需要的样本量根本不够。这时电信运营商又需要能够汇聚所有局点的全量样本信息,同时辅以联邦学习等技术,才能训练得到满足业务精度要求的AI 模型。除此之外,还面临AI模型训练占用资源多有可能会影响设备性能的隐患。
面对这样的挑战,华为创新地推出了云地协同解决方案,可以实现AI特性规模应用,这也是助力运营商迈向自动驾驶网络的关键。其中云端是指部署在公有云、合营云或 HCS 上的 NAIE 云端智能,地端则是指集成在网络管控单元的网络 AI、以及网元设备中的网元 AI。
云地协同加速 AI 特性规模应用
华为的云地协同是指在运行态下,云端、地端协同完成数据样本上云、模型状态管理、模型重训练、模型/知识下发、择优更新等系列AI模型任务。不仅如此,在云端还可以将汇聚全局的网络知识经验,以及通过全量数据训练得到的高精度模型,再以协同形式持续注入地端,支撑电信网络智能迭代,让网络越来越“聪明”。
云地协同实现架构
不妨以电信领域中实际发生的流程为例来见证一下云地协同的魅力。当某电信局点 DC PUE 模型三个月不更新后,模型精度开始劣化,下降到 70%。此时地端会在本地进行重训练,但由于样本少,资源有限,优化效果可能并不明显。而云端由于汇聚多个局点的样本数据,经过专家经验处理,会形成高质量的模型,于是云端的模型仓库就会把训练或优化的新模型包推送到地端。地端接收以后,就可以进行实际对比和评估,择优升级。
值得一提的是,目前 NAIE 还可以构建 DC 节能和无线网络优化等仿真场景。传统电信网络优化工作必须要先经过仿真系统验证,但是往往需要一周才能拿到优化参数,效率并不高。而如今通过华为云端的仿真系统来验证,既不会影响现实中网络性能,又可以迅速反馈,仅需一天就能反馈优化的最佳参数,大大提升了网络优化的工作效率。
概括而言,云地协同实现了“一点生效,多点复制”——当AI的特性在一个局点成功实施后,可以快速地形成知识和经验,并在其他局点进行复制,从而实现在全网规模应用。
云地协同三个发展阶段匹配不同AI场景
据了解,云地协同在实际应用部署时有三个阶段,电信运营商可以针对不同场景选择自己适合的阶段,从而大幅提高网络的资源效率。模型相对简单、算法结构稳定,仅需要根据本地数据进行模型参数优化调整的场景,例如想实现核心网变更在线机器值守,就更适合“云端训练初始模型+地端重训练”这一阶段;而模型相对复杂,需要华为持续进行模型算法结构优化的场景,例如无线KPI异常检测选择“云端模型分发+地端重训练”这个阶段效果更好;而如果模型复杂,还需要华为在云端高质量标注数据,并利用知识图谱以及仿真等知识能力进行模型优化的场景,就建议选择“云地实时协同、模型自动化演进”这个阶段了,例如 IP RAN/PTN 智能告警, DC PUE 优化等。
那么拥有强大的云地协同能力的iMaster NAIE究竟能给电信运营商带来哪些价值呢?在国内某运营商省级公司,多网元故障的占比接近 20%,对现网业务的影响是单网元故障的 9 倍以上,但是跨界的故障定位难造成运维成本居高不下。华为云地协同解决方案先通过地端上传现网告警、拓扑、配置等相关数据到云端,在云端再训练出故障聚合模型下发给地端,地端执行后,再通过网络知识库建立的故障传播图,对故障进行定界,快速找出故障根因,最终完成修复。部署之后,该运营商的故障工单压缩率提升比例 10%以上,不仅运维人员的派单效率显著提升,并且还提高问题定位效率。
作为华为自动驾驶网络解决方案中的重要智能化部件,iMaster NAIE一直在帮助运营商尽快实现数字化转型。而云地协同只是NAIE众多创新“黑科技”之一,NAIE还提供一站式网络AI云服务,让网络AI开发简单高效,并通过丰富的NAIE培训服务,助力运营商人才转型。目前,NAIE已经在多个运营商落地,我们相信,不远的未来,自动驾驶网络必将给电信运营商带来更大的惊喜。
责编AJX
-
华为
+关注
关注
215文章
34313浏览量
251201 -
AI
+关注
关注
87文章
30172浏览量
268440 -
自动驾驶
+关注
关注
783文章
13687浏览量
166157
发布评论请先 登录
相关推荐
评论