0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔、AMD等联手推出UALink,希望用它取代Nvidia NVLink接口

SDNLAB 来源:SDNLAB 2024-05-31 11:46 次阅读

周四,英特尔AMD博通、思科、谷歌、HPE、Meta和微软宣布正在建立一个新的行业组织——Ultra Accelerator Link(UALink)推广组,以指导数据中心AI加速器芯片之间连接组件的发展。作为一项新的开放标准,他们希望用它来取代 Nvidia专有的 NVLink 接口

2859d140-1efd-11ef-91d2-92fbcf53809c.png  

去年七月,由英特尔、AMD、思科、Meta等公司支持的超以太网联盟 (UEC) 正式成立,旨在引领高性能网络的发展。现在,UALink横空出世,用于在同一系统或形成pod 的一组系统内连接 GPU/加速器。

如何“连接” GPU ?

Nvidia作为GPU技术的领航者,显著推动了GPU技术在高性能计算、通用人工智能(GenAI)等多个领域的应用发展。通过GPU间的互联,可以实现更复杂问题的处理及应用性能的飞跃。

GPU互连主要有三种基本方式:

1. PCI 总线:一般支持4至8个GPU通过PCI总线相连,而利用GigaIO FabreX内存架构等技术,这一数量可拓展至32个。CXL 技术也展现出了潜力,但是 Nvidia 对此的支持有限。对于多种应用场景,这些可重组的GPU架构作为GPU直接扩展的替代方案,具有吸引力。

2. 服务器间互连:以太网或 InfiniBand 可以连接包含 GPU 的服务器。这种连接级别通常称为横向扩展,其中较快的多 GPU 域通过较慢的网络连接以形成大型计算网络。其中,以太网长期担当计算机网络的核心,超以太网联盟的成立进一步推动其高性能发展。英特尔Gaudi -2 AI 处理器在芯片上拥有 24 个 100-Gigabit以太网连接,强化了在以太网领域的地位。Nvidia未加入Ultra Ethernet联盟,其在 2019 年 3 月收购 Mellanox 后,几乎独占了高性能 InfiniBand 互连市场。超以太网联盟旨在成为其他企业的“InfiniBand”。值得注意的是,英特尔过去曾是InfiniBand的主要推动者。

3. GPU 到 GPU 互连:鉴于快速且可扩展的GPU连接需求,Nvidia开发了NVLink,这是一种目前可在GPU间以每秒1.8TB 的速率传输数据的GPU间连接技术。还有NVLink机架级交换机,能够在无阻塞计算结构中支持多达576个全互联GPU。通过NVLink相连的GPU被称为“pod”,表明它们拥有独立的数据和计算域。

对于其他厂商来说,除了AMD用于连接MI300A APU的Infinity Fabric外,别无选择。如同InfiniBand与以太网的情况,需要一个由竞争对手组成的某种“Ultra”联盟来填补非Nvidia“pod”领域的空白。而UALink正是这一需求的响应。

UALink 剑指 NVLink !

与 NVLink 类似,构建一个强大、低延迟且高效的横向扩展网络至关重要,该网络可以轻松地将计算资源添加到单个实例(即将 GPU 和加速器视为一个大型系统或“pod”)。

在此背景下,UALink 和开放行业规范的出现对于标准化下一代硬件的 AI 和机器学习、HPC 和云应用接口至关重要。该小组将开发一种高速、低延迟的互连规范,旨在加速AI计算Pod中加速器与交换机间的扩展通信

UALink 1.0规范将支持在AI计算Pod内部连接多达1,024个加速器,并允许Pod内加速器(如GPU)所附着的内存之间进行直接加载与存储操作。UALink发起小组已组建UALink联盟,预计该联盟将于2024年第三季度正式成立。1.0规范预期同样在2024年第三季度面世,并向加入UALink联盟的公司开放。

28670c48-1efd-11ef-91d2-92fbcf53809c.png

UALink Scale Up Pod

UALink 的一大优势是,它为业内其他厂商提供了一个追赶Nvidia的机会。如今,Nvidia已有能力生产NVSwitch盒,并将这些NVSwitch托盘集成进诸如Nvidia DGX GB200 NVL72之类的高端产品中。相比之下,英特尔今年销售了价值数亿美元的 AI 加速器,AMD凭借MI300X预计将售出数十亿美元的产品,但尽管如此,其在AI领域的规模仍无法与Nvidia相提并论。

UALink的出现,使得像博通这样的企业能够制造UALink交换机,助力其他企业实现规模扩展,并且这些交换机能跨不同厂商的多种加速器使用。此前,博通就制定了Atlas交换机计划,即利用AMD Infinity Fabric作为与Nvidia NVLink竞争的规模化升级方案,并应用于PCIe Gen7的博通交换机中,这些交换机可能会实现 UALink V1.0。

超以太网将继续作为向更多节点扩展的关键技术。博通可能会在其 800Gbps Thor 产品系列的早期型号中集成超以太网 NIC,但考虑到规范标准化的当前进程,全面实现UEC标准的支持可能还需等待下一代产品的问世。

28722682-1efd-11ef-91d2-92fbcf53809c.png

UALink Ultra Ethernet

为了支持 UALink,超以太网联盟主席 J Metz 博士表达了其积极的支持态度:“在很短的时间内,科技行业已经接受了AI和HPC揭示的挑战。在追求效率与性能提升的过程中,加速器,尤其是GPU的互连,需要一个全面的视角。我们相信UALink所采取的针对Pod集群问题的扩展解决方案,与UEC的横向扩展协议相得益彰。我们满怀期待,未来能携手合作,共同打造一个既开放又利于生态系统建设、覆盖全行业的解决方案,以全面满足不同场景下的扩展需求。”

最后

如今,许多企业都在尝试采用标准 PCIe 交换机,并构建基于 PCIe 的架构以扩展到更多加速器。然而,行业巨头们似乎视其更多为权宜之计。相比之下,Nvidia的NVLink成为了业内公认的横向扩展技术标杆。现在,一个开放标准的阵营正崛起,旨在打破其专有技术壁垒。

对于 AMD 和英特尔等公司来说,这提供了一条复制 NVLink 和 NVSwitch 功能的道路,同时能够与其他企业共享开发成果。博通这样的公司很可能是最大的赢家,无论是在横向还是纵向扩展场景下,它都将成为非Nvidia系统连接解决方案的首选供应商。无论AMD或英特尔谁能领先,博通都将作为连接技术的供应商而受益。对于超大规模数据中心运营商来说,投资标准化架构极具意义,无论最终采用哪家的终端设备。

这一切都需要时间。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9597

    浏览量

    169839
  • 以太网
    +关注

    关注

    40

    文章

    5171

    浏览量

    167444
  • 交换机
    +关注

    关注

    19

    文章

    2506

    浏览量

    96452
  • GPU芯片
    +关注

    关注

    1

    文章

    303

    浏览量

    5711
  • AI加速器
    +关注

    关注

    1

    文章

    66

    浏览量

    8580

原文标题:“复仇者联盟”集结!英特尔、AMD等联手推出 UALink,剑指英伟达NVLink!

文章出处:【微信号:SDNLAB,微信公众号:SDNLAB】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    挑战英伟达NVLink英特尔/谷歌等成立联盟,推出UALink 1.0

      电子发烧友网报道(文/吴子鹏)日前,英特尔、谷歌、微软、Meta以及其他科技巨头宣布成立一个新的行业组织——“Ultra Accelerator Link (UALink) 推广组”。目前
    的头像 发表于 06-03 06:31 2224次阅读
    挑战英伟达<b class='flag-5'>NVLink</b>!<b class='flag-5'>英特尔</b>/谷歌等成立联盟,<b class='flag-5'>推出</b><b class='flag-5'>UALink</b> 1.0

    科技巨头联手成立UALink推广组,挑战英伟达

    在周四,全球科技界的重量级企业英特尔、谷歌、微软、Meta等宣布共同创立一个全新的行业组织——"Ultra Accelerator Link (UALink) 推广组"。这一
    的头像 发表于 05-31 14:29 721次阅读

    科技巨头组建“复仇者联盟”,挑战英伟达的NVLink技术

    据报导,包括 AMD、谷歌、微软、英特尔(Intel)、博通(Broadcom)和思科(Cisco)在内的多家国际科技龙头联手,组成“复仇者联盟”,欲挑战 NVIDIA
    的头像 发表于 05-31 11:54 300次阅读

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    百亿亿次计算和万亿参数模型提供基础 NVIDIA推出世界首个高速GPU互连技术NVLink™,提供的速度远超基于PCIe的解决方案,是多GPU系统扩展内存和性能的理想选择。NVLink
    发表于 05-13 17:16

    英特尔:2025年全球AIPC将超1亿台占比20%

    英特尔行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年02月29日 09:15:26

    英特尔1nm投产时间曝光!领先于台积电

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月28日 16:28:32

    英特尔再创辉煌!1.4nm芯片工艺领航微电子时代,工业界的新里程碑?

    英特尔行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年02月26日 08:58:21

    英特尔登顶2023年全球半导体榜单之首

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月01日 11:55:16

    英特尔AMD处理器的区别和特点

    英特尔AMD处理器的区别和特点 英特尔(Intel)和AMD是全球最著名的两个处理器制造商。他们都提供高性能、可靠的芯片,为消费者和企业用户提供强大的计算能力。然而,他们之间存在很多
    的头像 发表于 01-30 14:28 1465次阅读

    英特尔酷睿14代处理器系列发布,Arrowlake/LunarLake24年问世

    处理器英特尔
    looger123
    发布于 :2024年01月10日 17:44:38

    高通与AMD、苹果、英特尔推出Snapdragon X Elite

    高通的Snapdragon X Elite专为运行Windows而设计,将在笔记本电脑方面与AMD英特尔竞争。 在今年的骁龙峰会上,高通发布了其迄今为止最强大的PC处理器。专为运行 Windows
    的头像 发表于 11-14 15:30 755次阅读

    #高通 #英特尔 #Elite 高通X Elite芯片或终结苹果、英特尔的芯片王朝

    高通英特尔苹果
    深圳市浮思特科技有限公司
    发布于 :2023年10月27日 16:46:07

    安装OpenVINO工具套件英特尔Distribution时出现错误的原因?

    安装OpenVINO™工具套件英特尔 Distribution时,出现错误: Python 3.10.0.ECHO is off. Unsupported Python version.
    发表于 08-15 08:14

    Arm Forge 22.1.3版用户指南

    。 Arm Forge支持许多并行体系结构和模型,包括MPI、CUDA和OpenMP。 Arm Forge是一款跨平台工具,支持最新的编译器和C++标准,以及英特尔、64位Arm、AMD
    发表于 08-10 06:29

    英特尔媒体加速器参考软件Linux版用户指南

    英特尔媒体加速器参考软件是用于数字标志、交互式白板(IWBs)和亭位使用模型的参考媒体播放器应用软件,它利用固定功能硬件加速来提高媒体流速、改进工作量平衡和资源利用,以及定制的图形处理股(GPU)管道解决方案。该用户指南将介绍和解释如何为Linux* 使用英特尔媒体加速器
    发表于 08-04 06:34