0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

算力网络的架构

倩倩 来源:算力基建 作者:算力基建 2022-08-17 09:32 次阅读

01算力网络的架构

之前我提到过,算力网络的作用,是为用户提供算力资源服务。 它将算力资源彻底“融入”通信网络,以一个更整体的形式,提供最符合用户需求的算力资源服务。

2294e8d2-1dcc-11ed-ba43-dac502259ad0.png

这是一个高度灵活、高度智能的网络。
算力网络的核心特征,是它通过算力,实现了对算力资源、网络资源的全面接管,可以让网络实时感知用户的算力需求,以及自身的算力状态。经过分析后,算力网络可以调度不同位置、不同类型的算力资源,为用户服务。 我们可以把它理解成一个“万能水龙头”。它总能够按你的需要,提供合适强度、合适温度、合适酸碱度的水流,让你拥有最好的用水体验。 那么,我们自然会很好奇,这个“万能水龙头”的背后,究竟是一张怎样的“水网”?它是如何进行资源控制和调度的? 接下来,我们就看看算力网络的体系架构。 首先,我需要提前说明一下,算力网络目前还是一个研究中的技术,并没有完全定型。所以,我下面给出的,只是各个运营商和设备商的算力网络架构(设想)图,相互之间会存在一定的差异。而且,未来也很可能在发生变动,请大家知悉。 下面的这几张,就是运营商和设备商比较有代表性的算力网络架构(设想)图:

22afd106-1dcc-11ed-ba43-dac502259ad0.png

中国移动(来自《算力网络技术白皮书》,2022)

22cc62e4-1dcc-11ed-ba43-dac502259ad0.png

中国移动(来自《算力网络白皮书》)

22e47532-1dcc-11ed-ba43-dac502259ad0.png

中国联通(来自华为WIN-WIN创新周,2022)

2300e6f4-1dcc-11ed-ba43-dac502259ad0.png

中国联通算力网络架构 (来自《算力网络架构与技术体系白皮书》)

230ef0fa-1dcc-11ed-ba43-dac502259ad0.png

中国电信云网融合目标技术架构 (来自《云网融合2030技术白皮书》)

2316084a-1dcc-11ed-ba43-dac502259ad0.png

华为(来自华为WIN-WIN创新周,2022) 这些图都有点复杂,相信大家都不太看得懂。我画一个简单的示意图,大家应该能看明白:

232ace2e-1dcc-11ed-ba43-dac502259ad0.png

简单来说,还是信息通信的分层思想,按层级来看,就能理清思路。为了减轻阅读压力,大家可以先把右边的绿色低碳和安全防护先pass掉。 我们从下往上,一层一层来看。

算网基础设施

算力网络的最下层,依然是算网基础设施层,这个逃不掉的。在算力网络中,基础设施不再仅仅是算力资源(CPU、存储、GPU等),还包括了网络资源。 在算力资源这边,对算力基础设施的整合,依旧是以云技术为核心,包括云原生、虚拟化、容器等。 在这里,和算力有关的一些底层新技术创新,也值得关注,例如异构计算、无服务计算(Serverless Computing)、存算一体、算力卸载等。大家可以先不管,以后再专题介绍。 网络这边,变化比较大。前几期文章给大家介绍过,云网融合趋势下的网络变化,用一句话来解释,就是把封闭的网,变得更开放(解耦),让它变成像计算机一样,可以通过软件的方式(软件定义),去给它下“命令”。 网络的底层(物理层、数据链路层),在传输网这边,依旧是光(只有光,才能保证通信带宽和容量等基本硬指标)。光底层的技术,例如OTN、OXC、ROADM、C+L频段、400G/800G啥的,都还是它们,没有什么区别。 在接入网那边,5G NR、PON(50G-PON),也没有什么特别(除了边缘算力会有点关系之外)。 变化大的,在网的上层。我们待会再讲。

算网一体(算力资源管理、网络资源管理)

再往上,开始有不一样了。因为算力网络要调度算力和网络资源,所以,需要对资源进行“预处理”和“衔接”。(这一层,其实很多架构里都归于编排管理层。我觉得单独拎出来,会比较容易理解一些。) 这一层,最值得关注的是算力路由。 算力网络和传统网络的最大区别,在于它所拥有三大特性。第一大特性,就是算力路由。 在算力之前,先要说说算力感知。 算力感知是网络对算力资源和算力服务的部署位置、实时状态、负载信息、业务需求的全面感知。中国移动的算力感知网络白皮书,就是站在算力感知的角度,进行分析的。

233e837e-1dcc-11ed-ba43-dac502259ad0.png

算力感知网络的体系架构 (来自中国移动《算力感知网络CAN技术白皮书2021》) 一方面,各算力节点将算网信息度量建模后统一发布,网络通过对多节点上报的算网信息进行聚合,构建全局统一的算网状态视图。另一方面,网络完成对业务算网需求的统一解析,实现对业务的全面感知,为基于业务需求进行算力调度提供保障。

234f39f8-1dcc-11ed-ba43-dac502259ad0.png

算力状态感知与通告 (来自《算力感知网络CAN技术白皮书2021》) 说白了,算力感知的目的,就是摸清手上到底有多少资源,用户到底有怎样的需求。 感知的对象,肯定需要进行度量和标识。于是,就有了算力度量和算力标识。 这两块,运营商目前非常重视。 算力这个东西存在多样性,也存在异构硬件芯片,所以,目前还没有形成统一的度量体系和标准。这会对建立统一的算力模型造成麻烦。很简单,度量单位都不一样,如何进行算力评估和计费? 算力标识的话,就相当于算力的身份证。用户通过算力标识指示所需服务,网络通过解析算力标识获取目标算力服务、算力需求等信息,为算力调度等提供基础。这个算力标识,必须是全局统一且可验证的。 好了,接下来,就是算力路由。 在刚才那个中国移动的算力感知网络架构图里,在算力资源层之外,还单独划了一个算力路由层。 算力路由层是算力感知网络的核心功能层,支持对网络、计算、存储等多维资源、服务的感知与通告,实现“网络+计算”的联合调度。 算力路由层,包括算力路由控制技术和算力路由转发技术,实现业务请求在路由层的按需调度。 说到算力路由,肯定就要说到CFN(Computing First Networking,计算优先网络)。 CFN广义上有时候会被用来指代整个算力网络。但是,在这里,CFN是一种分布式路由协议,在不同边缘云之间,按需进行着算力的调度和均衡。

2363e434-1dcc-11ed-ba43-dac502259ad0.png

CFN技术架构(来自《算力感知网络技术白皮书》) CFN这个东西其实很有意思。我们传统理解的路由,都是数据报文的路由。CFN这里的路由,是将计算资源状况和网络资源状况作为路由信息,发布到网络。然后呢,网络基于虚拟的服务ID,将计算任务报文,路由到最合适的计算节点。 目前,CFN协议主要通过在业务路由的BGP报文头中,以扩展字节信息的方式携带算力信息,将网络中计算节点的负载情况实时向全网进行扩散。 很显然,算力路由和CFN,是上一层进行算力调度的前提。

编排管理

再往上,就是算力网络的核心关键部分——编排管理。 搞过核心网NFV(网元功能虚拟化)的同学,对编排一定非常熟悉。在NFV架构里,就有编排。这是一个很有意思的词,把你给“收编、安排”了。说白了,就是完全控制和调度。 算力网络的第二大特性,就是算力调度。 算力调度,就是基于算网大脑,进行全网算力资源的智能编排、弹性调度。 更具体来说,是:完成算力运营及算力服务编排,完成对算力资源和网络资源的管理,包括对算力资源的感知、度量和OAM管理等;实现对终端用户的算网运营,以及对算力路由层和网络资源层的管理。 算力资源被感知、标识和感知之后,为了进行管理,还有一个算力资源管理的逻辑过程(也有被单独称为:算力管理层)。主要包括算力注册、算力OAM(性能监控、故障管理)、算力运营(计费管理、服务合约等)。

236c2d2e-1dcc-11ed-ba43-dac502259ad0.png

算力管理层(来自《算力感知网络CAN技术白皮书2021》) 这个功能划分就很麻烦。在有的运营商架构图里,这块被定义为算力管理层,单独存在。而在有的架构图里,没有这一层,划在了编排管理层。所以说,各个理解都不一样,很头大。反正大家要知道,有这么一个功能组。 想要实现它,肯定离不开一个控制网络的“神经中枢”。 调度和编排算力网络的核心控制部分,有的运营商把它叫做“算网大脑”。 这个“算网大脑”,有四个重要的作用: 1、获取全域实时的算、网、数资源,以及云、边、端分布情况,构建全域态势感知地图。 2、跨域协同调度,将多域协同的调度任务智能、自动地分解给各个使能平台,实现算、网、数的资源调度。 3、多域融合编排,针对多域融合业务需求,基于算、网、数的原子能力按需灵活组合编排。 4、智能辅助决策,基于不同业务的SLA要求、网络整体负载、可用算力资源池分布等因素,智能、动态地计算出算、网、数的最优协同策略。
算网管理编排层,维护全局静态的算力、服务和网络拓扑信息,并同步给各入口算力路由节点。算力路由节点维护算力服务的拓扑信息以及算力资源和网络的资源实时状态信息,通过分布式算力路由节点进行算网协同调度。 “算网大脑”是算力网络的神经中枢,统筹全局资源,重要性不言而喻。
在“算网大脑”中引入AI人工智能,那肯定是不用说了。除了AI之外,现在,运营商和设备商还打算往里面塞“数字孪生”、“意图引擎”,极力提升“算网大脑”的智能化水平。 说实话,仔细看管理编排层,我就有一种感觉,算力网络就是SDN和NFV技术的升级加融合,处处都是这两个技术的影子。只不过,表面又加上很多其它的技术,形成了一个更完整、更庞大的体系。

服务运营

算力大脑之上,是不是就没有了?并不是,别忘了,我们还有服务运营层。 服务运营层,说白了,就是给上层应用提供管控算力网络的接口。算网大脑不是真正的老板,只是一个“大管家”。真正管控网络的,是上层用户和应用。 服务运营层的目的,就是向上提供算力网络的能力开放。重点技术包括:算力交易、算力并网、算力封装、意图感知等。 算力网络的第三大特性,就是算力交易。

23818534-1dcc-11ed-ba43-dac502259ad0.png

路由、调度、交易,是算力网络三大特性 算力交易是算力网络的一个重要创新。 在算力和网络没有融合之前,用户使用谁家的云计算,就给谁钱,使用谁家的通信网络,就给谁钱。算网融合后,算力到处都是,调度来调度去,你到底该给谁钱? 算力交易,就是为了解决这个问题。 在算力交易场景中,会有一个可信泛在算力交易平台。

238b1108-1dcc-11ed-ba43-dac502259ad0.png

来自《算力网络——云网融合2.0时代的网络架构与关键技术》 大致过程是这样的: 首先,算力消费方提出详细的算力需求。然后,算力交易平台根据需求,将可用的资源整合,生成一个算力网络资源表。根据时延和成本等因素,会有对应的报价。接下来,算力消费方根据资源表,选择一个最适合自己的“套餐”。然后,就是在算力交易平台上签订交易合约。再然后,交易平台根据合约,通过算力网络调度资源,并且更新资源信息。最后,合约结束,服务终止,释放资源。

23988b44-1dcc-11ed-ba43-dac502259ad0.png

算力网络交易平台(来自《整合多方算力网络,实现计算资源利用率最优》,雷波) 在21世纪,凡是提到交易模式,就一定会牵扯到一个词——区块链。 是的没错,算力交易平台,也是借助区块链技术,实现分布式账本、匿名交易等功能。 综上所述,算力网络紧密围绕用户的算力需求,覆盖了算力产生、调度、交易、消费的全生命周期。算力网络想要实现的,就是算随人动,算随“需求”动,达到极致完美的算力供给与需求匹配,一点也不将就,一点也不浪费。

02算力网络的标准进展

这几年,算力网络在国内非常热门。不管是运营商还是设备商,都极为重视这个概念。 尤其是国内运营商,对算力网络简直就是到了狂热的地步。 原因很简单,国外运营商很少碰网,基本上就是搞搞通信,最多搞搞传统通信的云化。而国内运营商,既有网,又有云,特别希望把网和云的资源融合、盘活。而且,我们国家比较重视基础设施建设,算力网络是重要的数字基础设施,所以,运营商作为国企,也特别看重这块的积累。
一方面,为了掌握技术标准的主动权,另一方面,为了品牌宣传和形象造势,三大运营商在算力网络上就开始卷起来了。 2019年,是公认的算力网络元年。这一年的11月1日,中国联通率先行动,在北京PT展期间,发布了《中国联通算力网络白皮书》。这是国内第一本和算力网络相关的白皮书。 此后,国内运营商们争先恐后,陆续发布了多本白皮书,以及积极推动算力网络的标准制定。

23a89660-1dcc-11ed-ba43-dac502259ad0.png

在标准推进方面,我根据网上的资料,整理了一张表格,大致记录了各大标准组织在算力网络标准制定方面的情况,仅供参考:

23beb80a-1dcc-11ed-ba43-dac502259ad0.png

综合自中信证券,各大白皮书,官网消息

试验进展:

23d10ab4-1dcc-11ed-ba43-dac502259ad0.png

来自中信证券

03结语

从实际情况来看, 算力网络离我们还有很长一段距离。目前,我们处于云网融合的进展阶段,算网一体或算力网络,还在研究之中。 尽管如此,算力网络作为算力和联接力未来的发展趋势,是毋庸置疑的。算与网的融合一体,是必然的,也是整个通信行业的归途。传统通信作为“管道”,无法提升自己的价值,唯有全面投入云的怀抱,才是最好的出路。 好了,以上就是今天文章的全部内容。技术干货很多,看起来比较费劲。有些东西是我自己的理解,也不一定准确,欢迎大家批评指正。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 运营商
    +关注

    关注

    4

    文章

    2391

    浏览量

    44364
  • 通信网络
    +关注

    关注

    21

    文章

    2026

    浏览量

    51951
  • 算力
    +关注

    关注

    1

    文章

    925

    浏览量

    14732

原文标题:算力网络,到底是如何工作的?

文章出处:【微信号:算力基建,微信公众号:算力基建】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一体架构创新助力国产大AI芯片腾飞

    在湾芯展SEMiBAY2024《AI芯片与高性能计算(HPC)应用论坛》上,亿铸科技高级副总裁徐芳发表了题为《存一体架构创新助力国产大AI芯片腾飞》的演讲。
    的头像 发表于 10-23 14:48 223次阅读

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    、GPU、NPU,给我们剖析了芯片的微架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者能更好理解芯片。 全书共11章,
    发表于 10-15 22:08

    【「大模型时代的基础架构」阅读体验】+ 未知领域的感受

    算法的引擎GPU、GPU硬件架构剖析、GPU服务器的设计与实现、GPU集群的网络设计与实现、GPU板卡级调度技术、基于云平台的GPU集群的管理与运营等等: 翻阅部分章节,从GPU板
    发表于 10-08 10:40

    名单公布!【书籍评测活动NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架构分析

    追求单核心性能转向追求并行度,关注并研究芯片,这个方向是绝对没错的。这些年作者在自己所工作的量化金融行业取得的成绩有目共睹,他作为芯片的用户,熟悉芯片产品布局、逻辑单元构成、微
    发表于 09-02 10:09

    名单公布!【书籍评测活动NO.41】大模型时代的基础架构:大模型中心建设指南

    工作日内未联系,视为放弃本次试用评测资格! 书籍介绍 大模型是近年来引人注目的热点之一。大模型蓬勃发展的基础,是针对其需求设计的及基础架构。本书针对如何为大模型构建基础架构进行深入
    发表于 08-16 18:33

    基础设施的风险与挑战

    编者按网络有一个美好的愿景,就是希望网,能像电力和电网一样:
    的头像 发表于 06-13 08:27 494次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基础设施的风险与挑战

    中国移动网络大会的现场精华,都在这里!

    大家好,我是小枣君。4月28-29日,2024中国移动网络大会在苏州召开。我有幸前往现场参加了本次大会。按照惯例,来给大家汇报一下现场的情况。中国移动
    的头像 发表于 05-13 08:05 592次阅读
    中国移动<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>网络</b>大会的现场精华,都在这里!

    软通动力亮相2024中国移动网络大会,共绘网络新蓝图

    4月28日至29日,以“网络点亮AI新时代”为主题的2024中国移动网络大会在苏州隆重举
    的头像 发表于 05-06 10:20 444次阅读
    软通动力亮相2024中国移动<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>网络</b>大会,共绘<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>网络</b>新蓝图

    壁仞科技加入中国移动“融创未来”网络创新联合体

    近日,以“网络点亮AI新时代”为主题的2024中国移动网络大会在苏州举行。作为中国移动的
    的头像 发表于 04-30 09:36 850次阅读
    壁仞科技加入中国移动“融创未来”<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>网络</b>创新联合体

    力系列基础篇——101:从零开始了解

    相信大家已经感受到,我们正处在一个人工智能时代。如果要问在人工智能时代最重要的是什么?那必须是:
    的头像 发表于 04-24 08:05 1002次阅读
    <b class='flag-5'>算</b>力系列基础篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>101:从零开始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    智能规模超通用,大模型对智能提出高要求

    电子发烧友网报道(文/李弯弯)是设备通过处理数据,实现特定结果输出的计算能力,常用FLOPS作为计量单位。FLOPS是Floating-point Operations Per Second
    的头像 发表于 02-06 00:08 6070次阅读

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    网络面临三大挑战

    2024年,以AIGC为代表的人工智能技术将进一步激发需求,网络、智中心、超
    的头像 发表于 01-12 10:39 1007次阅读

    2024年趋势:网络、人工智能与6G技术的融合发展

    网络以“以网强”为核心,充分发挥我国基础网络优势,构建网深度融合的新型信息基础设施,通过
    的头像 发表于 01-11 09:30 1177次阅读

    网络发展的三个阶段分别是

    网络是指通过网络将分布在不同地点的计算机资源连接起来,共同完成大规模的计算任务。随着科技的不断发展,
    的头像 发表于 12-19 16:21 1046次阅读