0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Scaling law信仰下,新华三网络“越过山丘”

脑极体 来源:脑极体 作者:脑极体 2024-04-29 09:51 次阅读

如果大模型有信仰,那一定是“Scaling Laws(规模法则)”。

所谓“Scaling Laws”,就是模型性能会随着参数、算力、数据集的规模增加而提高。时间来到2024年,大模型领域依旧是“Scaling Laws”的统治区。

模型参数增长到万亿,训练集群从千卡到万卡、五万卡,前不久刚开源的一个高质量通用数据集达到45T,让开发者为了网络带宽而发愁……有人调侃:“在就近网络服务区下载好,再把硬盘用高铁飞机带过来,都比直接下载省时省力。”

人工智能时代爆炸式的数据增长,传统“马拉肩扛”的传输方式,存在易损坏、丢失的风险,也无法支持实时数据更新和交互,会直接影响到中国AI产业的先进性。对于攀爬Scaling law的中国AI产业来说,传统网络已经捉襟见肘,必须全面升级和重塑,更有效地支持大模型时代的联接需求。

wKgZomYuanuANs_WAAZAM4VuLm0353.jpg

近日,紫光股份旗下新华三集团以“×AI”(乘AI)为主题举办2024媒体与分析师沟通会,全新升级智算版数字大脑,并以全栈领先的灵犀智算解决方案,充分发挥新华三在算力和联接领域的核心优势,激发“算力×联接”的乘数效应,让算力更快、更强、更澎湃。

理念听起来很美好,具体怎么落地呢?网络如何给算力做乘法?会后,脑极体采访了新华三集团高级副总裁、网络产品线总裁曾富贵,就承载灵犀大模型落地的新华三AD-NET 7.0,及数据中心、园区、广域三大场景的相关技术、产品与解决方案,展开了深度交流。在AI产业攀爬Scaling law的当下,我们不妨来看看,新华三双A驱动的网络,是如何带攀登者们越过山丘的。

wKgaomYuan-ANx0gAASz_iMdPpo413.jpg

新华三集团高级副总裁、网络产品线总裁 曾富贵

眺望Scaling Laws山峰,那是网络升级的方向

数字化、智能化升级先升网,已经是一个常识。问题在于,究竟什么是网络的升级方向?

对此,曾富贵说过,网络的先进性是技术问题,但是先进网络的具体形态是用户选择的问题。

面向智算时代,AI产业化和产业AI化所需要的网络形态,已经被“Scaling Laws”法则所规定。

万亿参数,传输“费时”。大模型的参数量巨大,需要传输大量的数据,传统网络无法满足高带宽需求,需要接入带宽高达400G甚至达到800G的超大容量网络。

万卡集群,训练“费力”。AI大模型并行计算模式,催生了新的大规模网络架构,从千卡到万卡集群,未来更新的GPT模型可能需要十万卡、几十万卡支撑起来。而AI计算集群规模越大,通信量和复杂度越大,网络设备的规模、端口数、光模块的数量指数上升,传统网络面临越来越明显的传输效率瓶颈,一次通信延误,会拖慢整个训练过程,导致整体计算集群效能低下、成本高昂。

万里部署,使用“费心”。算力的分布式部署,全国一体化算网可以减少训练推理成本,解决算力紧缺、算力贵的问题。但跨东西部的算力流动与调度,会受限于“联接瓶颈”,抖动、时延、较长的通信时间,都会让用户身心俱疲,宁可用硬盘坐高铁送。

总而言之,在AI大模型场景和应用中,让模型供应商、算力服务商、应用开发者及用户不头疼,轻松翻越“Scaling Laws”的网络,就是先进网络。帮助产业攀爬Scaling Laws,新华三全新升级的AD-NET 7.0,由Application+AI双A驱动,如同一双“风火轮”,为AI大模型向前发展注入澎湃动力,成为一双智算时代的“鞋履”。

攀登者之力,双A驱动网络释放澎湃算力

神话故事中,哪吒踩着一双“风火轮”,获得了高速移动、自由驰骋的能力,极大地提高了战斗效率。对于攀爬Scaling Laws的AI产业者来说,新华三双A驱动的网络,正是一双能够释放澎湃算力的加速“战靴”。

全新升级的AD-NET 7.0,全面升级网络联接能力,构筑行业智能底座,从三个方面,为智算时代提供有力支撑:

wKgaomYuaoCAEs0CAAJF9Gnb4NE615.jpg

1.以网强算

AD-NET 7.0提供的网络基础设施,为AI模型的训练提供高效算力支持,为各种智能化服务提供按需的联接服务保障。曾富贵强调,AI赋能的网络,对数据中心,要充分释放大规模算力集群的潜力,让算力增效;对园区,要让最终客户能够随时随地接入算力,方便使用算力,满足各类业务对算力的智快至简体验需求;对广域网,要通过算力网络不同规模、不同行业客户都能享受算力建设带来的数字红利,实现业务智享的普惠型算力资源供给。

2.以算提智

新华三端到端智算能力,不仅解决了“算力焦渴”,还进一步结合过去21年积累的ICT运维领域知识和大量语料,融合打造出更懂行业运维需求的AI私域大模型——灵犀大模型。基于新华三在ICT领域的知识语料积累和上万名网络专家的专业经验,利用充足的算力训练和微调得到灵犀大模型,通过内置灵犀大模型升级AD-NET解决方案。

3.以智增效

算力网络变得复杂,靠人的普通管理是不行的,一定需要更强大、更高效的AI技术为网络提供“导航”。为了提升网络的智能化水平,AD-NET 7.0搭载了灵犀大模型,可以利用AI强大的创造力和交互能力,提升网络管理效率。

曾富贵直言,很多东西说起来很容易,实现起来很难。我们希望通过灵犀大模型,加上硬件原生智能,让整个网络更高效。这个覆盖面很大,目前我们在某些场景做了一些尝试,取得突破。目前,新华三已经探索出了大模型在数据通信领域落地的几个典型场景。

wKgZomYuaoGAWolEAAJ7iocZI9o809.jpg

AI可视:网络设备与平台协同计算,对设备日志、流量模型应用等多维信息进行AI分析,实现贯穿应用和网络基础设施的信息洞察。

AI调优:基于用户业务提供最优配置建议,持续学习网络状态,提供自进化的有线无线网络调优功能,体验识别准确度达92%。

AI排障:基于海量网络设备数据训练结果,实现链路级、设备级、网络级到应用级快速排障,覆盖90%以上的网络。

AI安全:网安联动,持续学习用户网络行为,精准标识可疑用户及可疑行为,实现动态安全防护。

以应用为牵引,以AI为抓手,“双A驱动”的新华三网络和AD-NET 7.0,成为千行百业加速智能化的一双“战靴”,提供澎湃的算力和动能。

越过山丘,从新华三网络看见智能中国的少年心气

数字化、智能化是中国乃至全球经济发展的重要趋势,也是摆在中国社会面前的一道新题目。征服Scaling Laws的高峰,夯实智能中国的基础,是一项庞大的系统工程,众多ICT相关企业都参与其中。

作为数字化解决方案领导者,新华三躬身入局智能新时代,激活了一种勇往直前的少年气。双A驱动的网络升级,就是这种气质的具象体现。

wKgaomYuaoGAW6OTAAIt4Y4nepg919.jpg

少年气,就是天命在我,敢于担起时代责任。

曾富贵提到,Application + Al Driven,既是趋势也是使命。我们希望,新华三的网络能够为后续算力的普惠化提供坚实的基础,这既是新华三的技术趋势,也是网络的使命。

少年气,就是学习能力强,始终没有停下进步的脚步。

曾经,新华三网络以应用(Application)为中心单轮驱动,在AI时代他们进行了重新的赋能、升级和诠释。经由灵犀大模型的全面融合,新华三网络拥有了全面智慧。

少年气,就是怀抱理想,为护佑苍生长出三头六臂。

以对AI训练最为关键的智算中心为例,AD-NET 7.0引入了多种负载均衡技术。针对不同智算场景,提供最适合的负载均衡技术组合,让每条链路都充分得到利用,提升智算中心算力规模和效率。

曾富贵介绍到,负载均衡之所以如此重要,是充分理解到传统计算模型与智算的计算模型有巨大的差异, 智算中心的流量不同于互联网流量,其存在单流流量大、整体流数量少、大量突发等特点,唯有通过智能化地负载均衡技术,将数据流量合理分散到不同链路上,才能保证无阻塞、不丢包,使智算中心得以顺利完成计算需求。

此外,新华三通过多元的产品形态,支撑AI时代的网络迭代。比如面向数据中心,提供了专为AI而生的S12500 AI系列产品,为AI模型的训练提供高效算力联接支持。面向广域网,升级400G端口能力、将算力因子纳入路由计算算法,提供服务化算力专线等,实现广域算力传送的全面优化。面向园区,全光+Wi-Fi 7,为基于AI的各种场景智慧化应用提供了最后一跳的高质量接入体验。

和新华三一样,中国AI产业及千行万企,也都勇敢踏上了智能时代的创新旅程。纵然攀爬Scaling Laws充满艰难,但越过山丘后的智能中国,也格外让人心驰神往。

对智能攀登者来说,新华三双A驱动的网络,是承载数据要素的路,是加速释放算力价值的“风火轮”,也是一同走过山高水远的同路人。

越过山丘的智能中国,恰似少年游。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29611

    浏览量

    267903
  • ICT
    ICT
    +关注

    关注

    3

    文章

    409

    浏览量

    36502
  • 新华三
    +关注

    关注

    0

    文章

    189

    浏览量

    14709
收藏 人收藏

    评论

    相关推荐

    常见的IPv6网络问题与解决

    ,用户和网络管理员可能会遇到一些问题。以下是一些常见的IPv6网络问题及其解决方案的概述: 1. 地址分配问题 问题描述: 在IPv6中,地址分配可能不如IPv4那样直观,因为IPv6地址空间非常大。这可
    的头像 发表于 10-30 09:25 192次阅读

    如何配置IPv6网络

    配置IPv6网络是一个涉及多个步骤的过程,包括规划、配置网络接口、设置路由协议、配置DNS以及测试和验证。 1. 规划IPv6网络 在配置IPv6网络之前,需要进行详细的规划,包括:
    的头像 发表于 10-29 17:35 329次阅读

    如何在RS-485网络中使用MSP430和MSP432 eUSCI和USCI模块

    电子发烧友网站提供《如何在RS-485网络中使用MSP430和MSP432 eUSCI和USCI模块.pdf》资料免费下载
    发表于 10-09 10:21 0次下载
    如何在RS-485<b class='flag-5'>网络</b>中使用MSP430和MSP432 eUSCI和USCI模块

    蓝牙Mesh 1.1网络的性能测试

    开发板的节点并组成网络,来分析在多个测试节点上进行的一系列实验结果,进一步探索蓝牙Mesh1.1网络的性能,包括网络延迟、远程配置和OTA, DFU性能的详细测试设置和结果等实用数据。
    的头像 发表于 08-20 14:22 486次阅读

    广和通通过IEC 62443-4-1网络安全体系认证

    近日,广和通已成功通过国际知名认证机构必维集团(Bureau Veritas,简称“必维”)的严格评估,正式获得IEC 62443-4-1网络安全体系认证证书,这标志着广和通在网络安全领域达到了国际化标准。
    的头像 发表于 08-20 09:31 317次阅读
    广和通通过IEC 62443-4-1<b class='flag-5'>网络</b>安全体系认证

    浪潮信息赵帅:开放计算创新 应对Scaling Law挑战

    Scaling Law带来的AI基础设施Scale up和Scale out的挑战,数据中心需要以开放创新加速算力系统、管理和基础设施的全向Scale进程,推动AI产业的创新发展。   开源开放推动人工智能创新与算力生态的全面发展 生成式人工智能的飞跃式进步正在加速智能时
    的头像 发表于 08-15 16:02 219次阅读
    浪潮信息赵帅:开放计算创新 应对<b class='flag-5'>Scaling</b> <b class='flag-5'>Law</b>挑战

    如何在PyTorch中实现LeNet-5网络

    在PyTorch中实现LeNet-5网络是一个涉及深度学习基础知识、PyTorch框架使用以及网络架构设计的综合性任务。LeNet-5是卷积神经网络(CNN)的早期代表之一,由Yann LeCun
    的头像 发表于 07-11 10:58 632次阅读

    二合一网络信号防雷器应用解决方案

    导致网络系统瘫痪。为了保护网络设备免受雷电和电涌的侵害,地凯科技网络信号防雷器应运而生。二合一网络信号防雷器是一种集成了网络信号防护与电源防
    的头像 发表于 05-21 10:52 331次阅读
    二合一<b class='flag-5'>网络</b>信号防雷器应用解决方案

    474-便携式手提万兆网络协议测试仪

    便携式手提万兆网络协议测试仪,以FPGA万兆卡和X86主板为基础,构建便携式的手提设备。
    的头像 发表于 05-16 09:39 321次阅读
    474-便携式手提万兆<b class='flag-5'>网络</b>协议测试仪

    cat6网络电缆特点体现在哪些方面

    Cat6网络电缆,全称Category 6电缆,是一种用于网络连接的高性能双绞线以太电缆。它是由电子工业协会(EIA)和电信工业协会(TIA)所定义的以太电缆标准之一,属于计算机
    的头像 发表于 04-29 11:30 897次阅读

    用STM32CubeIDE调试KZ8081网络PHY驱动,网络一直link不上的原因?

    最近在学习用STM32CubeIDE调试KZ8081网络PHY驱动,MPU是STM32H743,代码是基于IDE生成的LAN8742源代码,但是网络一直link不上。有高手写过这个驱动分享嘛?或者帮指点
    发表于 03-21 06:09

    二合一网络防雷器的原理、作用和应用方案

    二合一网络防雷器(二合一信号浪涌保护器) 是一种集电源防雷和网络信号防雷为一体的防雷设备,主要用于监空系统前端高清网络摄像机的防雷保护。本文介绍了二合一网络防雷器的工作原理、性能特点、
    的头像 发表于 12-25 10:41 2583次阅读
    二合一<b class='flag-5'>网络</b>防雷器的原理、作用和应用方案

    u-blox率先推出通过ETSI EN 303 645网络安全认证的蜂窝通信模块

    u-blox率先推出通过ETSI EN 303 645网络安全认证的蜂窝通信模块。
    的头像 发表于 12-22 17:13 735次阅读

    大模型的Scaling Law的概念和推导

    对于Decoder-only的模型,计算量(Flops), 模型参数量, 数据大小(token数),者满足:。(推导见本文最后) 模型的最终性能主要与计算量,模型参数量和数据大小者相关,而与模型的具体结构(层数/深度/宽度)基本无关。
    的头像 发表于 11-29 14:28 2183次阅读
    大模型的<b class='flag-5'>Scaling</b> <b class='flag-5'>Law</b>的概念和推导

    Scaling Law大模型设计实操案例

    纵轴是"Bits for words", 这也是交叉熵的一个单位。在计算交叉熵时,如果使用以 2 为底的对数,交叉熵的单位就是 "bits per word",与信息论中的比特(bit)概念相符。所以这个值越低,说明模型的性能越好。
    的头像 发表于 11-22 16:08 707次阅读
    <b class='flag-5'>Scaling</b> <b class='flag-5'>Law</b>大模型设计实操案例