0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里云、字节、浪潮信息、英特尔、电标院: OpenBMC是服务器固件大势所趋

全球TMT 来源:全球TMT 作者:全球TMT 2024-09-05 16:14 次阅读

北京2024年9月5日/美通社/ -- 近年来随着云计算、大数据特别是大模型的快速发展,数据中心规模不断扩张,产生了更多的服务器管理需求。传统BMC虽然可以实现部分管理,但是在快速迭代的当今尤其是在AI技术的驱动下,存在开发周期长、交付困难、应用单一等难题,并且由于其代码闭源也会导致隐藏的安全漏洞无法及时识别,限制了用户定制开发。OpenBMC凭借领先的开源理念、可扩展的软件架构,被大型互联网厂商广泛应用,并带动了产业连上下游共同探索,逐步成为服务器固件发展的"事实标准"。

在日前召开的2024开放计算中国峰会上,来自阿里云、字节跳动、浪潮信息英特尔以及电子标准院的专家,从自身探索和实践的角度,现身说法各家在OpenBMC方面的最新进展及未来规划。

OpenBMC大幅降低采购成本 阿里云新增修改10万+行自研代码库

随着云计算、大数据、AI等技术的发展,阿里云服务器规模已经达到数百万台,如何有效管理是摆在阿里云面前的现实问题。

而传统的BMC无法满足新兴运维需求,首先是庞大的服务器数量涵盖了多个品牌不同厂家,各厂家都基于某个IBV建立基础BMC能力再在上层定制开发,因此日常问题的解决需要拉通多方BMC软件规格和能力,带来时间和资源的大量浪费,效率低下;其次,不同品牌的服务器BMC代码也不尽相同,存在巨大的适配成本;第三是应用成本问题,传统BMC基础软件源代码和授权license都需要购买,后续还需要软件维护升级费用,成本较高。

OpenBMC迎合了当下软件质量发展和行业趋势,2020年左右OpenBMC软件逐步走向成熟,在北美一些CSP率先采用。阿里云服务器研发固件团队负责人李羿介绍,阿里云自2020年逐步采用OpenBMC产品,经过4年时间的探索与实践,已经形成行业一支领先的专业OpenBMC技术开发和交付团队,不仅可以在完成交付任务的同时结合云业务自身特点,还不断的回馈社区、贡献伙伴,在多个层面实现了行业领先。

如今,阿里云已经成功在x86、ARM等主流平台中实现了OpenBMC的替代,未来也将探索基于RISC-V等多元芯片平台的可能性。得益于OpenBMC的平台化优势,不同架构下的代码绝大部分都是相同的,只是针对不同平台略有微调。李羿表示,阿里云已经在实现代码的归一化,目前已经提交超过10万行代码,未来有望针对不同产品形态实现全面支持。

字节跳动打造OpenBMC应用新范式 问题分析定位效率大幅提升

从抖音到新晋AI工具"豆包",随着应用覆盖范围的进一步扩大、用户群体的持续增多,字节跳动需要维护的服务器数量已达百万级别,并且仍有不断增长的态势。如何高效、稳定且安全的管理服务器,成为运维团队面临的首要问题。

字节跳动固件架构师郏春辉介绍,传统BMC在解决固件运维难题上存在局限性,难以在服务器需求多样化的情况下满足快速交付的需求。开源OpenBMC能够吸纳先进理念和应用,提供了架构灵活、兼容性强的新选择,非常适合当下互联网与数字化的应用需求。

为了更好地解决固件运维的问题,字节跳动在OpenBMC固件运维能力基础上,不断进行技术创新,致力于提升OpenBMC固件的可观测性,对固件的运行状态、性能表现及内部各种活动进行全方位的监控和解析。通过加强对固件运行时软硬件状态的深入观察和理解,能够更快速地捕捉问题发生时的细节,从而实现高效精准的问题定位和处理。这种深入的可观测性不仅有助于提升系统的稳定性与可靠性,也为业务优化提供了宝贵的数据支持。

事实证明,这种方法非常有效。在引入了Perfetto和Kernel trace以后,问题定位分析时间,由原有的数小时乃至数天,降低至平均1小时以下;问题一次定位分析准确率,由40%提升至80%以上,效率提升非常明显。未来字节还计划在问题分析定位层面更进一步,借助AI技术和大数据分析,细化不同场景下的问题定位,充分发挥自动化优势,让故障无处遁形。

浪潮信息提供差异化方案满足不同需求下一代产品全面切换OpenBMC

当然,并非所有的企业都有阿里云、字节这样的技术积淀,对于中国市场来说,绝大部分企业用户并没有自研的能力,更倾向于选择表现稳定、安全的商业版本。对于这些企业来说,浪潮信息就是不错的合作伙伴。

去年,浪潮信息就发布了基于OpenBMC的InBry管理固件平台,采用更先进、更高效、更开放的创新架构和开发模式,快速适配各种算力场景,为用户提供开放、稳定、可靠的BMC管理固件,支撑多元算力时代的各类创新应用。"如果说前两年OpenBMC还只是一个趋势,现在则已经是大行其道了",浪潮信息服务器固件研发负责人王兴隆表示。

除了功能更丰富、应用更高效之外,开源版本的优势还在于开放性以及由此产生的安全性,后者也是当下企业关注的重点。对此,王兴隆表示,首先,开源社区采用的是最先进的Linux版本,相比传统BMC应用来说在代码上更完善,成熟性更高。其次,开源社区的代码上传需要多为行业专家的联合评审,接受更多社区参与者随时的监督与审查,所以质量更高。第三,基于开源和可扩展的软件架构,用户也可以将自身使用的安全模型、软件库移植到OpenBMC,这样就能打造符合自身需求的业务安全模型,所以更安全。

如今,浪潮信息更提出了"分层解耦"的理念,在技术上通过硬件层、中间层、应用层的划分实现自动适配、自动识别,达到技术赋能的多元化。此外,浪潮信息也正在与英特尔、英伟达AMD等业界领军企业合作,实现多元化平台的适配,为产业界提供更低成本、更高效的选择。

"在技术上,我们要基于OpenBMC实现创新,让更多企业享受开源应用的技术红利;产品上,我们将逐步在下一代平台全面切换到OpenBMC,打造更好的商业化版本;社区层面,我们也要建设更好的生态环境,让更多伙伴参与其中达成贡献,打造多元化的服务",王兴隆表示。

英特尔社区贡献名列前茅 持续推动OpenBMC技术创新

作为平台公司,英特尔也在推动OpenBMC发展中扮演了重要角色。每一代英特尔处理器平台的升级对于BMC固件适配来说都是不小的变革,而这些变革都朝着更便捷、更优化的方向来发展。从最初创立OpenBMC到今天,英特尔对于组织的贡献一直排在前列,每一代产品都会经历一年甚至更长时间的测试,以保证在性能、可靠性、稳定性等多方面的品质。

针对不同的应用场景,英特尔也会为客户提供接口实现功能上的定制化需求,这样可以通过代码或者软件的微调更适配于客户业务。同时,英特尔也提供了PFR固件保护功能(Platform Firmware Resilience),为保护企业服务器固件提供了一种全新的方法,可全面防止对服务器所有固件的攻击。

除了安全性的优化之外,如何有效降低服务器能耗也是OpenBMC固件优化的重点。从传统BMC到OpenBMC,其实服务器节能会变得更精准、更低碳。对此,英特尔在节点管理中就提供了能耗管理,并可以根据不同部件进行精细化运维。

从OpenBMC的投入上可以看出,这不仅仅是硬件层面的创新,更多需要融合软件、AI、生态等多个维度,而英特尔也需要扮演行业引领者的角色,为更多生态伙伴提供平台化、系统化的支持。

AI为OpenBMC发展注入活力 正在成为服务器固件"事实标准"

AI技术的出现带来了计算架构的变化,而BMC就势必需要针对这些多元异构的应用变化进行调整。与此同时,AI技术的出现也让大量传统的数据监测、分析变得更加高效,配合数据模型的构建,可以为未来的智能化管理提供技术支持,这也是AI对于OpenBMC带来的全新改变。

"事实上,OpenBMC正在解决传统BMC的瓶颈问题,包括兼容性问题、存在隐藏的代码故障、定制化需求等,已逐步成为了服务器固件的'事实标准'。" 中国电子技术标准化研究院技术总监、固件产业技术创新联盟标测组组长钟伟军表示。

如今,OpenBMC在国内的应用生产已经初具雏形。在相关社区中,已经形成了比较完备和稳定的基础代码,包括阿里云、浪潮信息等30多家公司也在不断提交代码贡献。

未来,希望能够有更多的产业界的伙伴参与到社区建设当中,把自身的优势、经验贡献到社区,让社区拥有更加完备的基础代码,让产业界上下游共享社区成果,有助于产业链生态的繁荣,形成合作共赢的局面。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9866

    浏览量

    171324
  • 服务器
    +关注

    关注

    12

    文章

    8977

    浏览量

    85100
  • 浪潮
    +关注

    关注

    1

    文章

    450

    浏览量

    23790
  • 字节
    +关注

    关注

    0

    文章

    39

    浏览量

    13709
  • 阿里云
    +关注

    关注

    3

    文章

    937

    浏览量

    42938
收藏 人收藏

    评论

    相关推荐

    英特尔阿里携手共创数智新纪元

    在2024年云栖大会的璀璨舞台上,英特尔携手阿里及众多行业精英,共绘AI时代计算的宏伟蓝图,探索前沿技术与多元解决方案的无限潜力。此次盛会,英特
    的头像 发表于 09-23 12:53 493次阅读

    先进封装大势所趋,国产供应链机遇大于挑战

    先进封装大势所趋
    发表于 06-21 14:15 0次下载

    浪潮信息分布式存储AS13000完成英特尔至强6能效核处理适配

    近日,浪潮信息分布式存储AS13000完成英特尔至强6能效核处理适配,实现每瓦性能提升2.3倍,以更高的效率、更优的成本满足海量多态数据的存储需求,充分释放数据价值。
    的头像 发表于 06-19 10:05 786次阅读
    <b class='flag-5'>浪潮信息</b>分布式存储AS13000完成<b class='flag-5'>英特尔</b>至强6能效核处理<b class='flag-5'>器</b>适配

    浪潮信息元脑®服务器率先支持英特尔®至强®6处理

    北京2024年6月7日 /美通社/ -- 6月6日,英特尔在全球范围内发布了英特尔®至强®6处理浪潮信息服务器产品线总经理赵帅受邀参会并
    的头像 发表于 06-07 15:36 349次阅读
    <b class='flag-5'>浪潮信息</b>元脑®<b class='flag-5'>服务器</b>率先支持<b class='flag-5'>英特尔</b>®至强®6处理<b class='flag-5'>器</b>

    浪潮信息推出业界首个支持50℃进液温度的服务器

    近日,浪潮信息再次突破技术边界,其旗舰产品NF5180G7服务器成为业界瞩目焦点。这款服务器不仅实现了1U空间内的超高密度设计,更在散热技术上取得了革命性进展,成为首个支持浸没式液冷50℃进液温度的
    的头像 发表于 05-09 11:27 597次阅读

    浪潮信息突破浸没式液冷服务器设计极限 业界首个支持50℃进液温度

    北京2024年5月6日 /美通社/ -- 近日,浪潮信息旗下产品NF5180G7成为业界首个可支持浸没式液冷50℃进液温度的服务器。NF5180G7是一款超高密度服务器,在1U空间内达到了性能、密度
    的头像 发表于 05-06 20:46 383次阅读
    <b class='flag-5'>浪潮信息</b>突破浸没式液冷<b class='flag-5'>服务器</b>设计极限 业界首个支持50℃进液温度

    浪潮信息&quot;源2.0&quot;大模型YuanChat支持英特尔最新商用AI PC

    北京2024年3月27日 /美通社/ -- 3月26日, 浪潮信息英特尔正式宣布,浪潮信息"源2.0系列基础大模型"已和最新的英特尔® 酷睿™ Ultra处理
    的头像 发表于 03-27 22:52 446次阅读
    <b class='flag-5'>浪潮信息</b>&quot;源2.0&quot;大模型YuanChat支持<b class='flag-5'>英特尔</b>最新商用AI PC

    浪潮信息英特尔合作推出一种大模型效率工具“YuanChat”

    3月26日,浪潮信息英特尔正式宣布,浪潮信息“源2.0系列基础大模型”已和最新的英特尔® 酷睿™ Ultra处理平台完成适配,本地推理速
    的头像 发表于 03-27 13:50 564次阅读
    <b class='flag-5'>浪潮信息</b>与<b class='flag-5'>英特尔</b>合作推出一种大模型效率工具“YuanChat”

    新升级 浪潮信息边缘服务器支持英特尔第五代至强处理

    北京2024年3月5日 /美通社/ -- 近日,浪潮信息边缘服务器NE5260G7完成第五代英特尔®至强®处理适配,实现平均性能提升 21%,可以为ICT 融合、零售、能源、交通、制
    的头像 发表于 03-06 14:34 346次阅读
    新升级 <b class='flag-5'>浪潮信息</b>边缘<b class='flag-5'>服务器</b>支持<b class='flag-5'>英特尔</b>第五代至强处理<b class='flag-5'>器</b>

    浪潮信息NE5260G7服务器适配第五代英特尔至强处理

    浪潮信息近日宣布,其边缘服务器NE5260G7已成功适配第五代英特尔至强处理,实现了平均性能21%的提升。这一创新产品不仅针对边缘AI算力场景支持了10余种加速芯片,还在存储场景上实
    的头像 发表于 03-06 09:29 824次阅读

    浪潮信息服务器NF5180G7荣获SPECjbb2015性能冠军

    近日,国际权威的标准性能评测机构(SPEC)公布了SPECjbb2015榜单,浪潮信息服务器NF5180G7凭借每秒558,626次企业应用业务处理的卓越成绩,蝉联性能冠军。这一出色的表现不仅刷新了算力记录,更标志着浪潮信息在算
    的头像 发表于 02-01 14:23 584次阅读

    浪潮信息英特尔联合发布全球首个全液冷冷板服务器参考设计

    北京2024年1月19日 /美通社/ -- 1月18日,浪潮信息英特尔联合发布全球首个全液冷冷板服务器参考设计,并面向业界开放,为全球液冷产业链上下游提供极具价值的参考样板,推动先进全液冷冷板
    的头像 发表于 01-19 16:52 488次阅读
    <b class='flag-5'>浪潮信息</b>与<b class='flag-5'>英特尔</b>联合发布全球首个全液冷冷板<b class='flag-5'>服务器</b>参考设计

    浪潮信息八路服务器创SAP SD评测最高性能

    北京2024年1月17日 /美通社/ -- 1月15日,据全球领先的企业应用软件提供商SAP发布的最新SAP SD评测结果,浪潮信息TS860G7服务器创下1,659,970 SAPS的最高
    的头像 发表于 01-17 20:49 577次阅读
    <b class='flag-5'>浪潮信息</b>八路<b class='flag-5'>服务器</b>创SAP SD评测最高性能

    IDC: 浪潮信息居全球服务器份额第二

    下降22.8%。在全球服务器市场增长乏力的背景下,浪潮信息服务器以21.8%的销售额增速,实现逆势增长,出货量和销售额均位居全球第二。
    的头像 发表于 12-12 12:27 966次阅读
    IDC: <b class='flag-5'>浪潮信息</b>居全球<b class='flag-5'>服务器</b>份额第二

    浪潮信息澎湃认证:浪潮信息集中式存储携手仪i-stack操作系统软件完成兼容性认证

    近日, 仪i-stack操作系统软件与浪潮信息集中式存储AS/HF系列产品完成并通过浪潮信息澎湃技术相互兼容性测试认证, 测试结果显示
    的头像 发表于 12-08 16:40 603次阅读
    <b class='flag-5'>浪潮信息</b>澎湃认证:<b class='flag-5'>浪潮信息</b>集中式存储携手仪<b class='flag-5'>电</b><b class='flag-5'>云</b>i-stack<b class='flag-5'>云</b>操作系统软件完成兼容性认证