0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

挑战英伟达NVLink!英特尔/谷歌等成立联盟,推出UALink 1.0

Felix分析 来源:电子发烧友网 作者:吴子鹏 2024-06-03 06:31 次阅读

电子发烧友网报道(文/吴子鹏)日前,英特尔、谷歌、微软、Meta以及其他科技巨头宣布成立一个新的行业组织——“Ultra Accelerator Link (UALink) 推广组”。目前,UALink推广组正在抓紧制定一项新的行业标准,用于推进数据中心内连接的大规模AI系统的高速和低延迟通信,摆脱英伟达NVLink在AI加速器连接方面的统治。

对于这项新的行业标准,AMD数据中心解决方案总经理Forrest Norrod表示,“行业需要一个可以快速推进的开放标准,这种标准允许多家公司为整个生态系统增加价值。”

英伟达统治AI加速器市场

有分析观点认为,英伟达在AI加速器方面的统治力,已经超过了当年英特尔对于PC处理器的统治,这让英伟达享受到了AI时代巨大的产业红利。根据英伟达2025财年第一财季财报,该公司营收达到260亿美元,同比增长262%;净利润高达148.1亿美元,同比上升628%。

那么,英伟达为什么能够在AI加速器领域体现出如此强悍的统治力呢?笔者认为主要源于三点:核心芯片、软件生态和连接技术。

在核心芯片方面,时间回溯到2020年,在GTC 2020上,英伟达推出了基于Ampere架构的新一代GPU——NVIDIA A100,这颗芯片作为通用型工作负载加速器,成为国内外AI科技巨头争抢购买的芯片,此后甚至被禁止出口到中国市场。NVIDIA A100展现了AI加速器发展的“暴力美学”,以英伟达的数据来说,NVIDIA A100相较于前一代性能暴涨了20倍。在GTC 2024上,英伟达又推出了B100芯片,架构代号为Blackwell,显存达192GB。在AI加速器芯片方面,英伟达并不是单单某一颗产品强,而是拥有一个强大的产品矩阵。在架构方面,英伟达陆续推出了Volta架构、Turing架构、Ampere架构、Hopper架构和Blackwell架构,提供B100、H200、L40S、A100、A800、H100、H800、V100等众多的芯片产品组合。

同时,针对这些产品,英伟达提供强大的软件支持。就以英伟达的CUDA生态来说,无论是通用加速,还是计算加速,CUDA生态都能够提供充足的支持。英伟达自2006年推出CUDA以来,CUDA和GPU的并行计算能力使英伟达收获了庞大的用户群。CUDA 平台包括硬件架构和编程模型,为开发人员提供了更直接、高效地利用 GPU 进行并行计算的方式。在COMPUTEX 2023 大会期间,英伟达方面透露的数据显示,目前CUDA拥有超过400万开发人员,超过 3000个应用程序,历史上CUDA下载量达到惊人的4000万。更让当前阶段CUDA显得炙手可热的是,仅仅是在2022年,CUDA下载量就有惊人的2500万,目前依然在高速增长的状态。

英伟达在AI加速器方面,第三个显著的优势就是连接技术。AI算力集群是人工智能发展的重要基础设施,就以当前最火热的AI大模型来说,单卡是无法支撑的,需要一个强大的AI算力集群。如果是基于英伟达算力卡的集群,那么主要的连接技术是NVLink和InfiniBand技术,分别负责近距离并行计算和扩大集群规模。NVLink可以直接完成GPU之间内存的互相访问,无需CPU的干预。目前英伟达NVLink已经更新到了第五代,第五代NVLink大幅提高了大型多GPU系统的可扩展性。单个NVIDIA Blackwell Tensor Core GPU支持多达18个NVLink 100 GB/s连接,总带宽可达1.8 TB/s,比上一代产品提高了两倍,是PCIe 5.0带宽的14倍之多。72-GB200 GPU NVLink域(NVL72)等服务器平台利用该技术为当今异常复杂的大型模型提供更高的可扩展性。

同时,英伟达还有NVSwitch。NVSwitch芯片是一种类似交换机ASIC的物理芯片,通过NVLink接口可以将多个GPU高速互联到一起,从而提升服务器内部多个GPU之间的通讯效率和带宽。比如,NVIDIA A100 Tensor Core GPU引入了第三代 NVLink和第二代 NVSwitch,使每CPU带宽和减少带宽都增加了一倍。如果是通过第四代 NVLink和第三代NVSwitch,可以连接八个NVIDIA H100 Tensor Core GPU的系统,具有3.6 TB / s的二等分带宽和450 GB / s的缩减操作带宽,与上一代相比,这两个数字分别增加了1.5倍和3倍。

综上所述,英伟达在AI加速器方面拥有非常全面的布局,且这种系统性方案是目前最好的AI加速方式,没有之一。统计数据显示,目前英伟达在AI加速器芯片市场的占比超过了九成,被称为人工智能领域“无可争议的领导者”。当然,这也就意味着,除英伟达AI加速器芯片外,其他厂商的芯片很难捕捉到市场机会,即便是国际大厂推出的相关芯片。一个重要的原因在于,英伟达这套围绕AI加速器布局的系统,不仅强大而且封闭,对非英伟达芯片的兼容性很差,这也被称为AI芯片发展的“英伟达路径”。让厂商很绝望的是,如果选择顺从这条路径,其产品也无法对英伟达芯片造成很大的冲击,除非是面向某些特殊的用途。

因此,英特尔、谷歌等科技巨头现在希望从连接入手,在英伟达AI加速器生态圈上撕开一个口子,以获取更多的市场份额。

UALink野心勃勃但也有隐忧

除了英特尔、谷歌、微软、Meta这四家,UALink联盟成员还包括AMD、惠普企业、博通和思科等,不过作为主要的核心供应商,Arm公司尚未参加。UALink联盟的主要职责是监督UALink规范未来的发展。

UALink联盟认为,UALink和行业规范对于标准化下一代AI数据中心和实现的 AI 和机器学习、HPC 和云应用程序接口至关重要,该小组将制定一项规范,定义AI计算舱中加速器和交换机之间扩展通信的高速、低延迟互连。

目前,UALink联盟提议的第一个版本UALink 1.0连接多达1024个AI加速器,UALink 1.0基于包括AMD的Infinity Fabric在内的开放标准。AMD的Infinity Fabric采用了一种分布式架构,其中包含多个独立的通道,每个通道都可以进行双向数据传输。这种设计使得不同核心之间可以直接进行快速而低延迟的通信,从而提高了整体性能。Infinity Fabric分为SCF和SDF。SDF负责数据传输,而SCF则负责控制传输命令。

从技术演进来看,如果Infinity Fabric技术成为UALink规范的主要组成部分,那么用户可能会担心UALink 1.0最终的连接效率问题。据悉,Infinity Fabric中的SDF部分基本是HT总线衍生的产物,这个总线原本是用于CPU的串联,而UALink 1.0的使用场景是GPGPU,两者之间在并行数据量要求方面差异巨大。因此,有业者认为,UALink 1.0规范预计不会规模性进入市场,只是奠定UALink规范的基础框架,但很难对NVLink+NVSwitch这套体系造成很大的挑战。

当然,博通和思科会积极地完善UALink 1.0以及后续的标准,博通可能会在800Gbps的 Thor产品中推出一款早期的Ultra Ethernet NIC,思科则预计将研发对标NVSwitch的相关产品。另外,目前已经加入的各家巨头,也都是各自有自己的小算盘:谷歌拥有用于训练和运行 AI 模型的定制芯片、TPU和Axion;微软Maia 100新芯片已经在Bing和Office AI产品上测试,急于进入市场;Meta此前公布了自主研发芯片MTIA的最新版本,这是专门为AI训练和推理工作设计的定制芯片系列。因此,有观点认为,一旦UALink成事,那么这些拥有自研芯片的公司将成为最大的受益者。但是,由于各自研芯片公司在芯片、架构、集群层面的理解不一,这也可能拖累UALink的发展,使得UALink虽然看上去有大批的创新力量,但是创新效率却不足。

结语

据悉,UALink 1.0将在同一时间向加入该联盟的公司提供,另外带宽更高的更新规范UALink 1.1将于2024年第四季度推出。由于英伟达不在这个联盟,也不必参加这个联盟,预计UALink 1.1推出时可能会选择直接对标某一代的NVLink。不过,在UALink能够全面对抗NVLink之前,包括微软和Meta在内的公司依然是大规模哄抢英伟达的AI加速器芯片。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9879

    浏览量

    171432
  • 谷歌
    +关注

    关注

    27

    文章

    6141

    浏览量

    105080
  • 英伟达
    +关注

    关注

    22

    文章

    3743

    浏览量

    90806
收藏 人收藏

    评论

    相关推荐

    英伟计划2025年推出基于Arm架构的消费级CPU,挑战英特尔和AMD

    ,这款CPU将融合英伟的CPU和GPU设计,专注于高端设备市场,并预计在2026年3月左右进一步扩大推广范围。这一举措标志着英伟试图打破英特尔
    的头像 发表于 11-05 15:29 475次阅读

    英伟超越苹果成为市值最高 英伟取代英特尔加入道指

    苹果公司的市值,重新成为全球市值最高的公司。 在AI领域,英伟正疯狂奔跑,我们看到有外媒报道英伟正在与马斯克旗下的人工智能初创公司xAI进行洽谈,计划进行投资。 我们还看到有外媒报
    的头像 发表于 11-05 15:22 320次阅读

    消息称英特尔英伟封装订单

    市场需求,但仍面临供需失衡的挑战。据业内消息,英伟GPU大厂已转向英特尔寻求封装产能支持,凸显了当前市场的紧迫性。
    的头像 发表于 08-06 10:50 447次阅读

    谷歌14家科技巨头联合成立安全AI联盟

    在7月18日举行的阿斯彭安全论坛上,全球科技界的领军力量——谷歌、微软、亚马逊、英特尔英伟、IBM、思科、Paypal、OpenAI1
    的头像 发表于 07-19 15:38 397次阅读

    科技巨头联手成立UALink推广组,挑战英伟

    在周四,全球科技界的重量级企业英特尔谷歌、微软、Meta宣布共同创立一个全新的行业组织——"Ultra Accelerator Link (UALink) 推广组"。这一
    的头像 发表于 05-31 14:29 956次阅读

    科技巨头组建“复仇者联盟”,挑战英伟NVLink技术

    据报导,包括 AMD、谷歌、微软、英特尔(Intel)、博通(Broadcom)和思科(Cisco)在内的多家国际科技龙头联手,组成“复仇者联盟”,欲挑战 NVIDIA 的
    的头像 发表于 05-31 11:54 578次阅读

    英特尔、AMD联手推出UALink,希望用它取代Nvidia NVLink接口

    周四,英特尔、AMD、博通、思科、谷歌、HPE、Meta和微软宣布正在建立一个新的行业组织——Ultra Accelerator Link(UALink)推广组,以指导数据中心AI加速器芯片之间连接组件的发展。
    的头像 发表于 05-31 11:46 1741次阅读
    <b class='flag-5'>英特尔</b>、AMD<b class='flag-5'>等</b>联手<b class='flag-5'>推出</b><b class='flag-5'>UALink</b>,希望用它取代Nvidia <b class='flag-5'>NVLink</b>接口

    谷歌数据中心处理器市占率跃升,超越AMD仅次于英伟英特尔

    值得注意的是,谷歌并未像英伟英特尔和AMD传统处理器厂商那样对外销售芯片,而是主要应用TPU系列处理器于自身业务及云服务中。
    的头像 发表于 05-23 15:30 552次阅读

    进一步解读英伟 Blackwell 架构、NVlink及GB200 超级芯片

    新的标准。Blackwell架构和GB200 超级芯片有望推动英伟在人工智能领域更进一步,巩固其在高性能计算和人工智能技术领域的领先地位。随着亚马逊网络服务、谷歌云和微软 Azure
    发表于 05-13 17:16

    英伟、AMD、英特尔GPU产品及优势汇总

    主导地位,其销售额预计将达到400亿美元,远超过竞争对手AMD和英特尔。那么这三家公司都有哪些GPU产品,各自的产品有何优势呢?   英伟                                            
    的头像 发表于 05-10 00:59 4823次阅读

    英伟垄断地位遭挑战谷歌、高通联手打破

    然而,一家名为UXL的联合体正在努力打破这一局面。该机构由高通、谷歌英特尔、ARM诸多知名科技巨头构成,意欲引导开发者从对英伟芯片的依
    的头像 发表于 03-26 15:24 451次阅读

    英伟显卡和英特尔显卡哪个好

    英伟(NVIDIA)和英特尔(Intel)在显卡领域都有各自的优势和特点,具体哪个更好取决于您的需求和预算。
    的头像 发表于 03-01 17:26 7079次阅读

    英伟采用英特尔封装技术提升产能

    台积电仍将坚守主打地位,为英伟供应高达90%的尖端封装产能。但推测中提到,自2024年第二季度起,英伟有意将英特尔的产能纳入多款产品的制
    的头像 发表于 02-01 15:27 605次阅读

    英伟吸纳英特尔加入供应链,缓解先进封装产能紧张

    据it之家引用的报道称,预计自今年2月份起,英特尔将会正式成为英伟供应链成员,每月能够提供5000片晶圆的产能。英特尔已表达愿意参与英伟
    的头像 发表于 01-31 13:55 549次阅读

    英特尔推出汽车版AI芯片,与高通、英伟展开竞争

    在2024年的国际消费电子展(CES)上,英特尔正式发布了一款专为汽车领域设计的人工智能(AI)芯片。这一创新产品标志着英特尔正式进军车载AI市场,与高通和英伟
    的头像 发表于 01-15 15:43 912次阅读