ETH-X超节点:开辟AI算力约束突破的新路径-电子发烧友网

面对人工智能大模型的迅速发展及其对算力资源的急剧增长需求，单芯片性能提升遭遇瓶颈，同时通过Scale Out策略扩展多机集群以增加算力也遇到了局限性。在此背景下，中国信通院与腾讯携手GPU、CPU、交换机芯片制造商、服务器供应商、网络设备厂商及互联网企业等多方力量，共同发起超大带宽ETH-X（以太网）超节点计划，旨在通过技术创新与行业合作，构建开放可扩展的HBD（高带宽域）超节点系统样机，探索AI算力提升新途径，为构建ETH-X超节点互联开放协作产业生态提供支撑。同时，将共同编制相关技术规范，为行业树立标准，引导超节点技术高质发展。

AI大模型发展与算力需求

AI大模型的发展依赖于持续提升算力。根据Scaling Law（规模定理），增大模型规模与增加训练数据量是直接提升AI大模型智能水平与性能的关键途径。但对集群算力需求的将呈指数级增长。

长序列是AI大模型发展的另一个重要方向。长序列提高AI大模型回答问题的质量、处理复杂任务的能力以及更强的记忆力和个性化能力的同时,也会加大对训练和推理算力资源的需求1，尤其是对显存资源的需求。因此满足AI大模型发展需求，算力能力的持续提升成为一个重要基础。

图1 长序列带来的准确率收益以及显存需求

单芯片算力提升遇阻、

scale out集群算力提升受限

当前,提升集群算力已面临一些明显的制约因素。首先，单芯片性能提升受到HBM容量带宽增长赶不上算力增长速度的限制，内存墙问题制约算法发挥。如在典型模型与并行方式下，Nvidia Hopper一代芯片的有效算力(HFU)明显低于Ampere一代芯片,如图2所示。另一种通过Scale out扩展集群规模提升整体算力的方式也受到GBS(Global Batch Size)不能无限增长的限制，导致在集群规模增大到一定程度后，HFU出现明显下降。最后，模型参数量增大需要更大的模型并行规模，模型并行中Tensor并行或MOE类型的Expert并行都会在GPU之间产生大量的通信，并且这部分通信很难与计算进行overlap。而当前典型一机八卡服务器限制了Tensor并行的规模或Expert并行通过机间网络，这都会导致HFU无法提高。

图2 不同型号GPU以及不同规模集群对HFU的影响

通过scale up扩大HBD（超带宽域）的超节点成为突破方向

HBD（High Bandwidth Domain）是一组以超带宽（HB）互联GPU-GPU的系统2。HBD内GPU-GPU通信带宽是HBD之间GPU-GPU通信带宽的数倍。如Nvidia H100 提供900GBps HB带宽，HBD间GPU-GPU通信带宽只有100GBps。因此在模型并行中将数据量大、无法overlap的部分限制在一个HBD内完成。

当前，HBD限制在一台服务器内，典型1机8卡服务器是8张GPU卡之间通过某种HB连接技术实现互联，构成一个HBD=8的系统。然而更大的参数规模、更长的序列长度、更多的MOE专家数量、更大的集群规模，都造成了更多的通信数据量。HBD=8的情况下，大量的数据通信均需经过HBD间的scale out网络，因此通信占比提高、HFU下降的问题凸显。

通过构建更大的HBD系统，以scale up方式提升系统算力是解决上述问题的有效途径之一。如MIT与Meta的研究论文中，通过建模分析3，论证了扩大HBD对训练性能的提升效果。另外，Nvidia也实现了不同规模HBD系统并进行了部署与验证4。

图3 HBD超节点典型代表与业务收益举例

Nvidia将HB互联不仅用于GPU-GPU之间，而是将其应用到GPU-CPU/Memory的超大带宽互联，例如GH200、GB200产品。通过此方式为GPU提供一个超带宽访问CPU/Memory的能力。

Nvidia产品具备支持GPU-CPU/Memory的统一内存编制以及GPU通过内存语义接口read/write直接访问CPU/Memory的能力，具有更高效、更直接的特点。但其同步操作的方式会对时延进行限制，制约可访问CPU/Memory的距离与容量。另外，目前的软件生态中，未有支持直接通过内存语义访问CPU/Memory的系统。

相反若使用异步的memory offload方式将降低对时延的约束，并发利用多节点CPU/Memory，发挥HB互联的带宽优势。另外，当前memory offload已具备一定软件生态上的基础，例如Zero offload5。

综上所述，超节点是一个以超大带宽（HB）互联16卡以上GPU-GPU以及GPU-CPU/Memory的scale up系统，以HBD超节点为单位，通过传统scale out扩展方式可形成更大规模、更高效的算力集群。超节点Scale Up的核心需求是超大带宽（HB），但规模不需要很大。Scale Out的核心需求是超大规模。因此Scale Up网络与Scale Out网络更适合是相互独立共存的两张网络。

图4 Scale Up超大带宽与Scale Out超大规模共同构建高算力AI集群

ODCC ETH-X计划构建开放超节点产业生态

超节点的核心是HB互联技术，当前工业界已实现的超节点系统均是采用私有技术与协议实现HB互联，例如Nvidia的NVLINK。但此类私有技术与协议由单一企业进行维护，无法保证技术长期、高效的发展。另外，从HBD超节点产品完善角度也无法保证系统的开放，导致无法形成良性、开放的产业生态。

以太网技术凭借开放的生态、多样的产业链环境，为技术的长期演进发展提供支撑。当前以太网技术上从端口带宽及交换容量方面已具有较强的竞争基础。如以太网单端口800G MAC标准已成熟并产业化，以太网单芯片51.2T交换容量 ETH-switch也已在2023年产品化商用。

目前，以太网HB接口GPU产品的日益丰富，HBD超节点系统正逐步依托于以太网互联技术，实现向更为模块化、多元化的结构转型，有效促进了多方厂商的积极参与，各厂商专精于系统内的不同组件或子系统开发，显著提升了HBD超节点产品化的多样性和方案的丰富度，为HBD超节点技术长期演进奠定稳固基石，确保其在应对未来挑战时能够持续进化，保持领先的技术竞争力与生态活力。

图5 ETH-X超节点参考架构与预期收益评估

图6 ETH-X技术规范构成与项目计划

为推动算力产业的发展，ODCC网络组启动了ETH-X超节点系列项目。该项目由中国信通院、腾讯联合快手科技、燧原科技、壁仞科技、华勤技术、锐捷网络、新华三、云豹智能、云合智网、盛科通信、立讯精密、光迅科技等合作伙伴共同推动，以产品化样机以及相关技术规范为目标，打造大型多GPU互联算力集群系统。该项目计划在2025年秋季前完成ETH-X超节点样机软硬件研发与相关业务系统验证测试，同时发布ETH-X超节点技术规范1.0。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30098

浏览量
268385
人工智能

人工智能

+关注

关注
1791

文章
46841

浏览量
237523
算力

算力

+关注

关注
1

文章
925

浏览量
14737

原文标题：ETH-X超节点：探索突破AI算力约束的新途径

文章出处：【微信号：SDNLAB，微信公众号：SDNLAB】欢迎添加关注！文章转载请注明出处。

企业AI算力租赁是什么

企业AI算力租赁是指企业通过互联网向专业的算力提供商租用所需的计算资源，以满足其AI应用的需求。

发表于 11-14 09:30 •162次阅读

GPU算力开发平台是什么

随着AI技术的广泛应用，算力需求呈现出爆发式增长。AI算力租赁作为一种新兴的服务模式，正逐渐成为

发表于 10-31 10:31 •122次阅读

本源“量超融合先进计算平台”入选2024算力中国·年度重大成果

近日，2024中国算力大会在河南郑州开幕。大会主论坛上，“算力中国·年度重大成果”正式发布8项具有突破性意义的技术成果。本源量子与郑州大学国

发表于 10-16 08:06 •307次阅读

本源“量<b class='flag-5'>超</b>融合先进计算平台”入选2024<b class='flag-5'>算</b><b class='flag-5'>力</b>中国·年度重大成果

浅析三大算力之异同

随着一年多前ChatGPT的出现引爆人工智能（AI）浪潮，支撑大模型背后的“算力”概念突然闯进我们的视野，成为科技圈炙手可热的新词，引领着最新潮流。作为数字经济时代新生产力，也许不少人

发表于 08-30 12:56 •630次阅读

浅析三大<b class='flag-5'>算</b><b class='flag-5'>力</b>之异同

哈尔滨即将迎来算力新纪元:中国移动智算中心节点盛大启用

8月22日，来自“哈尔滨发布”公众号的最新消息振奋人心，宣布了中国移动智算中心（哈尔滨）节点的一项重大进展——其超万卡智算集群将于8月30日正式投入运营。这一里程碑式的投用，不仅标志着

发表于 08-22 15:19 •605次阅读

大模型时代的算力需求

现在AI已进入大模型时代，各企业都争相部署大模型，但如何保证大模型的算力，以及相关的稳定性和性能，是一个极为重要的问题，带着这个极为重要的问题，我需要在此书中找到答案。

发表于 08-20 09:04

光子计算芯片最新突破，峰值算力超1000tops，比电芯片更适合大模型

意味着它的算力密度已经超过了先进制程的电芯片。据光本位科技介绍，矩阵规模（算力密度）和单节点光辨识度（

发表于 07-08 07:18 •4385次阅读

光子计算芯片最新<b class='flag-5'>突破</b>，峰值<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>超</b>1000tops，比电芯片更适合大模型

江苏省算力基础设施发展专项规划：打造算力供给服务新高地

按照规划，江苏将全力打造“2+N+X”算力网络梯次多元布局，包括南京、苏州两个国家级核心算力枢纽集群，N个省内城市级数据中心（云计算中心、智算

发表于 04-26 15:58 •381次阅读

千亿美元打造一个系统，成本越来越高的AI超算

电子发烧友网报道（文/周凯扬）从近年来新发布的超算机器和新的HPC AI性能榜单可以看出，AI算力已经在

发表于 04-09 00:19 •3011次阅读

256Tops算力！CSA1-N8S1684X算力服务器

（基于BM1684X的高算力服务器）高算力AI处理器BM1684

发表于 03-23 08:02 •1446次阅读

智能算力规模超通用算力，大模型对智能算力提出高要求

的缩写，即每秒所能够进行的浮点运算数目（每秒浮点运算量）。算力可以分为通用算力、智能算力和

发表于 02-06 00:08 •6096次阅读

大茉莉X16-P，5800M大算力称王称霸

算力

Rykj365
发布于 :2024年01月25日 14:54:52

立足算力，聚焦AI！顺网科技全面走进AI智算时代

“立足算力，聚焦AI”，顺网科技进军AI智算时代的号角已被吹响。 1月18日，顺网科技（300113.SZ）以“跃迁·向未来”为主题的战略升

发表于 01-19 10:57 •438次阅读

AI算力应用中的光模块产品

以ChatGPT为代表的AI大模型应用普及将推动算力需求快速增长，服务器产业链是其中重要的受益环节之一，AI计算的普及将推动服务器产业链光模块向800G升级提速。

发表于 01-02 15:32 •495次阅读

弘信电子与AI算力服务器合资，助力国产算力芯片落地

此外，弘信电子近期在AI算力业务上取得了突破性进展，这并非源自本土化的积累，而是依赖于团队敏锐的战略眼光和强烈的创新动力。此次投资是弘信电子在AI

发表于 12-25 09:30 •839次阅读

搜索历史

ETH-X超节点:开辟AI算力约束突破的新路径

评论

企业AI算力租赁是什么

GPU算力开发平台是什么

本源“量超融合先进计算平台”入选2024算力中国·年度重大成果

浅析三大算力之异同

哈尔滨即将迎来算力新纪元:中国移动智算中心节点盛大启用

大模型时代的算力需求

光子计算芯片最新突破，峰值算力超1000tops，比电芯片更适合大模型

江苏省算力基础设施发展专项规划：打造算力供给服务新高地

千亿美元打造一个系统，成本越来越高的AI超算

256Tops算力！CSA1-N8S1684X算力服务器

智能算力规模超通用算力，大模型对智能算力提出高要求

大茉莉X16-P，5800M大算力称王称霸

立足算力，聚焦AI！顺网科技全面走进AI智算时代

AI算力应用中的光模块产品

弘信电子与AI算力服务器合资，助力国产算力芯片落地