0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息赵帅:开放计算创新 应对Scaling Law挑战

全球TMT 来源:全球TMT 作者:全球TMT 2024-08-15 16:02 次阅读

北京2024年8月15日/美通社/ -- 日前在2024开放计算中国峰会上,浪潮信息服务器产品线总经理赵帅表示,智能时代,开源模型和开放计算激发了人工智能产业生态的创新活力,面对大模型Scaling Law带来的AI基础设施Scale up和Scale out的挑战,数据中心需要以开放创新加速算力系统、管理和基础设施的全向Scale进程,推动AI产业的创新发展。

wKgaoma9th6AVbJVAAC1lErw8VU701.jpg


开源开放推动人工智能创新与算力生态的全面发展

生成式人工智能的飞跃式进步正在加速智能时代的到来,数据中心基础设施面临全方位创新,将越来越依赖更加广泛的全球化开放协作,加速AI技术创新与应用,共同构建一个充满创新活力的智能世界,而激发人工智能创新活力,开源开放是核心和源泉。

模型开源激发人工智能创新活力。随着开源大模型能力的不断增强和开源生态的持续壮大,带动模型、应用到产业的全面发展,三分之二的基础模型选择开源,超过80%以上的AI项目使用开源框架进行开发,开源模型的下载量突破3亿次,并衍生出超过 3万个新模型,Llama 3.1、通义千问、源2.0等开源大模型成为人工智能创新的驱动力。

硬件开放完善人工智能算力生态。人工智能带来指数级增长的算力需求,全球已有上百家公司投入新型AI芯片的研发与设计,百花齐放的算力芯片需要统一的算力平台才能快速推向市场,实现落地。开放加速规范OAM的出现大大加速多元算力芯片的适配兼容过程,大幅降低资源投入,使算力部署和迭代提速,支撑上层大模型和AIGC应用的快速迭代成熟。目前,90% 高端AI芯片基于OAM规范设计,去年浪潮信息刚刚发布的基于OAM规范的开放加速计算平台NF5698G7与多款主流AI加速芯片适配兼容,基于OAM的智算产业生态圈日趋完善。

我们可以看到,AI时代,算力正在呈现出多元化的发展趋势。为应对AIGC、云计算、大数据等应用复杂且不断变化的计算需求,不仅仅是GPUCPUFPGAASIC等芯片也在朝着更加多样化和专用化的方向发展。而且无论是手机电脑、边缘设备、CPU通用服务器、加速服务器都具有了AI计算的能力,可以说一切计算皆AI,AI算力已经深入到千行百业,渗透进每一个计算设备里。面向人工智能的算力范式不断革新,基于CPU的通用服务器不仅要承载大数据、关键计算、科学计算外,也要承担AI应用的重要任务,这也是CPU通用服务器的重大机遇。

但随着应用范式的多样化,目前x86、ARMRISC-V等不同架构的CPU处理器百花齐放,仅中国,就有10多种CPU处理器,不同CPU协议标准不统一,同时为了更好的适合AI推理高并行的计算特点,CPU总线互联带宽、内存带宽及容量也需要特别优化,使得系统功耗、总线速率、电流密度不断提升……多种因素叠加之下,硬件开发、固件适配、部件测试资源等时间激增,给算力系统设计带来巨大挑战。

为了缩短从芯片到算力系统的转化时间,给用户提供更快、更好的算力支撑,CPU端也亟需构建智算时代的CPU统一底座, 能够兼容不同芯片厂商、多代产品。2024开放计算中国峰会上,开放算力模组(OCM)规范正式启动,首批成员包括中国电子标准院、百度、小红书、浪潮信息、联想、超聚变、英特尔AMD等机构和企业。

wKgZoma9th-AL50sAADMAXcn7K4485.jpg


全新的开放算力模组OCM规范,旨在建立基于处理器的标准化算力模组单元,通过统一不同处理器算力单元对外高速互连、管理协议、供电接口等,实现服务器主板平台的深度解耦和模块化设计,兼容不同架构的多代处理器芯片,方便客户根据人工智能、云计算、大数据等多样化应用场景,灵活、快速匹配最适合的算力平台,推动算力产业高质量快速发展。

OCM规范是国内首个服务器计算模组设计规范,产业界上下游伙伴将基于OCM规范,共同建立标准化的算力模组单元,构建开放合作、融合创新的产业生态,为用户提供更多通用性强、绿色高效、安全可靠的算力选择。

以开放创新的全向Scale应对大模型第一性原理

算力、算法和数据是推动人工智能发展的三驾马车,自Transformer架构出现以来,大模型性能与其参数量、计算当量、数据量的协同作用尤为显著,业界称之为大语言模型的第一性原理——Scaling Law。

智算时代,需要用开放的理念来加速算力系统全向Scale,从而应对大模型的Scaling Law。随着大模型能力的持续进化,算法规模和复杂性不断增加、数据量越来越大,算力需求也在不断攀升,需要同时应对单系统性能提升Scale up与多系统大规模扩展Scale out两个方向扩展的挑战,对数据中心基础设施、算力管理、迭代升级等都提出了更高要求。

wKgaoma9th-AbzXlAABtwq38_7g324.jpg

在算力方面,智算中心需要同时应对两个方向的扩展,分别是强算力支持、一机多芯、多元多模的单机系统Scale up要求和大规模AI组网、高带宽、资源池化的大规模化扩展Scale out要求,以开放加速模组和开放网络实现算力的Scale。UBB2.0开放标准支持更高算力规格的加速卡、可以实现更大的OAM domain互联,未来可以支持8000+ 张加速卡Scale up,突破大模型All to All通信过程中的互联瓶颈。同时,大模型的发展需要更大规模的算力系统,浪潮信息开放网络交换机可实现16000+个计算节点10万+加速卡的Scale out组网,满足加速卡之间的互联通信需求,带宽利用率高达95%+。

在管理方面,需要解决跨平台适配、模块化架构、快速迭代的Scale要求,以开放的固件解决方案实现了管理的Scale。当前,异构算力多元分化,异步迭代,管理接口规范各不相同,导致固件平台分支版本庞大,相互割裂,无法归一,单一企业资源在维护和适配如此众多的分支版本方面捉襟见肘。为解决一系列管理挑战,需要依托于开源社区的开源固件平台,构建原生解耦架构提升可扩展性,建立统一标准的接口规范,支持用户对于自主模块进行定制化,实现标准接口规范下的异步、自主定制迭代,以满足智算时代的算力迭代需求。

在基础设施方面,数据中心面临智能算力扩展的两大Scale挑战:一是GPU、CPU算力提升,单芯片单卡功耗急剧增加,单机柜在供电和制冷上面临着Scale up支撑挑战;同时,Scaling Law驱动GPU规模无限膨胀,达到万卡、十万卡级别,带来了数据中心层级Scale out的支撑挑战,需要开放标准和开放生态将实现基础实施的Scale,满足快速建设、高算力/高能耗支撑要求。采用开放标准、开放生态构建的数据中心基础设施,能更好地匹配智算时代多元、异构算力的扩展和迭代速度,进而支撑上层智能应用的进一步普及。以浪潮信息为例,基于开放标准推出的液冷冷板组件,支撑单机系统内GPU和CPU核心算力原件Scale up扩展;推出模块化、标准接口的120kw机柜,兼容液冷、风冷场景,支撑柜内更大的部署需求;推出基于开放标准的预制化集装箱数据中心,大幅压缩建设周期,其扩展性很好的满足了AI算力系统的Scale需要。

开放计算为数据中心的全向Scale,提供了一个可以迅速传递到整个产业链的"通道"。目前,开放加速模组和开放网络实现了算力的Scale,开放固件解决方案实现了管理的Scale,开放标准和开放生态实现了基础设施的Scale。开放计算对于智算时代至关重要,需要用开放应对多元算力,用开放促进算力的Scale,基于开放创新构建的全向Scale能力将会成为未来AI基础设施的核心驱动力,加速智算时代的创新,加速人工智能的前行。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    9123

    浏览量

    85328
  • 浪潮
    +关注

    关注

    1

    文章

    458

    浏览量

    23851
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268887
  • 人工智能
    +关注

    关注

    1791

    文章

    47183

    浏览量

    238258
  • 大模型
    +关注

    关注

    2

    文章

    2423

    浏览量

    2643
收藏 人收藏

    评论

    相关推荐

    浪潮信息AI存储性能测试的领先之道

    MLCommons,一个致力于推动全球 AI系统发展的顶级工程联盟,汇聚了包括谷歌、斯坦福大学在内的众多顶尖企业和研究机构。作为该联盟的创始成员之一,浪潮信息自2020年起便积极参与其中,共同探索
    的头像 发表于 10-29 16:30 238次阅读
    <b class='flag-5'>浪潮信息</b>AI存储性能测试的领先之道

    浪潮信息推出AIGC存储解决方案

    近日,在科技创新浪潮中,浪潮信息成功举办了“元脑中国行”全国巡展的杭州站活动,此次盛会不仅汇聚了业界的精英与目光,更见证了浪潮信息在AIGC(人工智能生成内容)领域的一次重大突破。会
    的头像 发表于 07-03 11:16 714次阅读

    浪潮信息元脑®服务器率先支持英特尔®至强®6处理器

    北京2024年6月7日 /美通社/ -- 6月6日,英特尔在全球范围内发布了英特尔®至强®6处理器,浪潮信息服务器产品线总经理受邀参会并发表演讲。会上,浪潮信息多款元脑服务器
    的头像 发表于 06-07 15:36 392次阅读
    <b class='flag-5'>浪潮信息</b>元脑®服务器率先支持英特尔®至强®6处理器

    CCF-TCIST走进浪潮信息 共话AI时代存储创新

    CCF信息存储技术专委会走进浪潮信息 共话大模型时代的存储创新之道 北京2024年6月7日 /美通社/ -- 近日,中国计算机学会信息存储技
    的头像 发表于 06-07 14:27 281次阅读
    CCF-TCIST走进<b class='flag-5'>浪潮信息</b> 共话AI时代存储<b class='flag-5'>创新</b>

    浪潮信息与北京伙伴共筑AI新生态

    近日,2024浪潮信息区域ISP伙伴战略签约仪式在京圆满落幕。此次盛会,浪潮信息与航天星桥、中天瑞合、圣世博泰、浩然泰同、浩普诚华、众创佳业等20家北京元脑生态伙伴共襄盛举,签署了战略合作协议。
    的头像 发表于 05-31 11:33 740次阅读

    整数智能与浪潮信息签署元脑生态战略合作协议

    近日,整数智能与浪潮信息签署元脑生态战略合作协议。双方将秉持协同共生、开放共赢的原则,在元脑生态的框架内开展AI与数据科学领域的深度协作
    的头像 发表于 05-27 11:21 432次阅读
    整数智能与<b class='flag-5'>浪潮信息</b>签署元脑生态战略合作协议

    浪潮信息携手生态合作伙伴发布智能制造边缘创新方案

    浪潮信息近日在苏州成功举办了名为“2024 星火聊缘 | 智造之城 边缘赋苏”的边缘计算生态技术沙龙,标志着其在江苏地区企业数字化转型系列活动的正式启动。
    的头像 发表于 05-24 11:19 652次阅读

    【中心动态】 走进浪潮信息

    5月8日,RISC-V国际人才培养认证中心主任蒋学刚一行,到访浪潮电子信息产业股份有限公司(以下简称“浪潮信息”),受到深圳区域副总经理段青云、产品经理陶耀民的热情接待。浪潮信息是全球
    的头像 发表于 05-13 17:42 448次阅读
    【中心动态】 走进<b class='flag-5'>浪潮信息</b>

    浪潮信息“元脑”品牌全面升级,全力进击人工智能!

    在北京举行的浪潮信息生态伙伴大会(IPF2024)上,浪潮信息总经理胡雷钧表示,未来,一切计算皆AI,“元脑”全面升级为包括所有计算产品的智算品牌,同时“元脑”也是生态品牌。
    的头像 发表于 04-19 10:42 625次阅读
    <b class='flag-5'>浪潮信息</b>“元脑”品牌全面升级,全力进击人工智能!

    浪潮信息生态伙伴大会IPF2024:发展人工智能+,加速创新落地

    4月17日,浪潮信息在北京举办的生态伙伴大会IPF2024上提出,发展人工智能+,要坚持“以应用为导向,以系统为核心”,着重激发创新活力、拓展创新路径、加速创新落地,推动人工智能成为百
    的头像 发表于 04-18 09:12 615次阅读

    浪潮信息与英特尔合作推出一种大模型效率工具“YuanChat”

    3月26日,浪潮信息与英特尔正式宣布,浪潮信息“源2.0系列基础大模型”已和最新的英特尔® 酷睿™ Ultra处理器平台完成适配,本地推理速度提升100%。
    的头像 发表于 03-27 13:50 628次阅读
    <b class='flag-5'>浪潮信息</b>与英特尔合作推出一种大模型效率工具“YuanChat”

    XEDP与KeyarchOS完成浪潮信息澎湃技术认证

    澎湃技术认证。 经联合测试, 双方产品功能兼容性良好,整体运行流畅,性能表现优异,满足用户在云计算、大数据、人工智能等领域对企业级数据存储的多种需求。   浪潮信息澎湃技术认证是基于多元、创新的通用
    的头像 发表于 02-27 17:56 469次阅读
    XEDP与KeyarchOS完成<b class='flag-5'>浪潮信息</b>澎湃技术认证

    智邦国际与KeyarchOS完成浪潮信息澎湃技术认证

    KeyarchOS V5完全兼容,整体运行稳定高效,满足用户的关键性应用需求,获得相应兼容性认证证书。     浪潮信息澎湃技术认证是基于多元、创新的通用计算平台,与供应链及软件服务等生态合作伙伴共同构建的产品互兼容性认证体系,
    的头像 发表于 01-25 13:51 438次阅读
    智邦国际与KeyarchOS完成<b class='flag-5'>浪潮信息</b>澎湃技术认证

    液冷数据中心生态建设启动:浪潮信息力推绿色算力产业发展

    "液冷数据中心生态建设",浪潮信息服务器产品线总经理受邀出席。此次生态建设启动旨在进一步完善液冷数据中心的生态,未来将联合多家产业上下游单位,打通产、学、研、用多层级,通过技术创新
    的头像 发表于 01-07 10:53 636次阅读

    安证通与KeyarchOS完成浪潮信息澎湃技术认证

    浪潮信息澎湃技术认证体系由多元化创新的通用计算平台与供应链及软件服务生态合作伙伴共同搭建,包括“产品部件认证”、“平台软件认证”以及“应用软件认证”三个类别,旨在全面推进整个产业链中的共建、共享和共赢,打造
    的头像 发表于 12-27 15:30 708次阅读