0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达发布超强AI加速卡,性能大幅提升,可支持1.8万亿参数模的训练

微云疏影 来源:综合整理 作者:综合整理 2024-03-19 12:04 次阅读

3月19日消息,NVIDIA宣布成功研发AI加速卡——Blackwell GB200,预计年内开始交付。这是NVIDIA在GTC开发者大会上所公布的最新成果。

GB200创新性的运用了NVIDIA独创的新一代AI图形处理器架构Blackwell。NVIDIA CEO黄仁勋明确指出:“尽管Hopper已然优秀,但我们需要更强的GPU推动发展。”

得益于NVIDIA每两年进行一次GPU架构升级以提高性能的策略,全新的基于Blackwell的加速卡比之前的H100更为强大,尤其适用于AI相关任务。

Blackwell GPU卓越表现使得AI性能达到惊人的20PetaFLOPS。相比之下,基于Hoper架构的H100仅为4PetaFLOPS。NVIDIA强调,这种额外的处理能力将极大地便利人工智能厂商顺利培训复杂且大规模的模型。

Blackwell GPU大大刷新了人们的认知,其庞大身形由台积电4纳米(4NP)工艺制成,包含两个独立制造的裸晶(Die),共有2080亿个晶体管。为了方便捆绑芯片,它采用NVLink 5.0技术。两枚Blackwell芯片在同一封装中,相较以往的GPU而言,整体性能显著提升达2.5倍,若处理FP4八精度浮点运算,则性能甚至可飙升至5倍之多。校园秘

关于GB200,NVIDIA宣称,其合成物包括两个B200 Blackwell GPU以及一个基于Arm的Grace CPU。很多人惊讶地发现 NvTech的首批量产计算机将其性能获得了提升超过30倍,同时降低成本和能耗。根据NVIDIA的数据分析,他们现有的硬件只用2000个Blackwell GPU就够再去完成诸如1.8万亿个参数模型这样的运算任务,且只消耗4兆瓦的电力。在参数为1,750亿的GPT-3 LLM基准测试中,Nvidia的GB200的性能甚至超越了H100 7倍。规律纪律意识

对于致力于拥有庞大需求企业的成品服务,NVIDA推出了包含36个CPU及72个Blackwell GPU的NVL72服务器,并附赠一体式水冷散热解决方案,产能可实现高达720 PetaFLOPS的AI训练性能,或者达到惊人的1,440 PetaFlops。另外,还有144个壁搏立帆、576个GPU以及240TB的内存。单据一份官方报道显示,早先以至于要运行一带有1.8万亿个参数模型的堆栈,原先需要8000个 Hopper GPU,外加15兆瓦的电力。

英伟达透露,同类机型已被亚马逊、谷歌、微软和甲骨文计划纳入他们的云服务产品之中,由于对具体采购量的保密,外界暂无确切消息。但据Nvidia表示,已经接到了Amazon AWS对于采用2万片 Blackwell芯片建成的服务器集群的购买计划。通过Node-to-Node NVLink 5.0,每个机架将被18块GB200芯片和9块交换机装满。而不同于此,英伟达的 Skeeter InfiniBand可连接多达144个节点,Quantum-X800 InfiniBand则最高可支持64个节点。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4694

    浏览量

    102133
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4516

    浏览量

    127628
  • AI
    AI
    +关注

    关注

    87

    文章

    27637

    浏览量

    265229
收藏 人收藏

    评论

    相关推荐

    NVIDIA突破美国禁令,将在中东部署其高性能AI/HPC GPU加速卡

    Ooredoo达成合作协议,将在中东地区部署其高性能AI/HPC GPU加速卡。这一举动不仅标志着NVIDIA在中东市场的战略布局取得了重大突破,也引发了外界对于如何防止这些先进技术流向中国的广泛讨论。
    的头像 发表于 06-24 14:47 543次阅读

    进一步解读英伟 Blackwell 架构、NVlink及GB200 超级芯片

    计算工作负载、释放百亿亿次计算能力和万亿参数人工智能模型的全部潜力提供关键基础。 NVLink释放数万亿参数AI模型的
    发表于 05-13 17:16

    英伟发布最强AI加速卡Blackwell GB200

    英伟在最近的GTC开发者大会上发布了其最新、最强大的AI加速卡——GB200。这款加速卡采用了
    的头像 发表于 03-20 11:38 633次阅读

    英伟发布性能大幅提升的新款B200 AI GPU

    英伟宣称,B200在性能上比以往最好的GPU快30倍不止。由它构成的服务器集群相比上一代,运算能力飞跃性提升,甚至能使大语言模型的训练速度
    的头像 发表于 03-20 09:37 421次阅读

    英伟发布最强AI加速卡GB200,开启新一代AI图形处理时代

    英伟正式发布了其最新、也是迄今为止最强大的AI加速卡——GB200。这一重大发布标志着
    的头像 发表于 03-19 11:26 673次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b><b class='flag-5'>发布</b>最强<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>GB200,开启新一代<b class='flag-5'>AI</b>图形处理时代

    今日看点丨英伟发布最强 AI 加速卡--Blackwell GB200;三星面临罢工 存储市场供需引关注

    1. 英伟发布最强 AI 加速卡--Blackwell GB200 ,今年发货   3 月 19 日,
    发表于 03-19 11:08 979次阅读

    英伟发布最强AI加速卡

    行业芯事行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年03月19日 09:16:43

    英伟市值1.96万亿美元

    英伟市值1.96万亿美元 英伟股价一天之内大涨16%;英伟
    的头像 发表于 02-24 15:22 675次阅读

    宁畅参与发布AI加速卡液冷设计白皮书

    近日,由宁畅参与起草的《基于标准PCIe接口的人工智能加速卡液冷设计》白皮书正式发布。该技术白皮书由开放计算标准工作委员会(OCTC)归口,旨在为冷板式人工智能加速卡的设计提供重要指导。
    的头像 发表于 01-09 11:28 501次阅读

    瞬变对AI加速卡供电的影响

    ,尤其是在学习和推理时。这种需求不断地将供电网络的边界推向前所未有的新水平。这些高密度工作负载变得愈加复杂,更高的瞬态需求推动配电网络的每个部分都必须高效运行。AI加速卡严格的功耗要求对系统性能也有影响。本文将讨论
    的头像 发表于 12-01 18:10 280次阅读
    瞬变对<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>供电的影响

    AMD 为超低时延电子交易推出 Alveo UL3524 加速卡

    AMD Alveo UL3524 - 新款 AMD Alveo 金融科技加速卡能为交易公司和经纪商提供突破性的纳秒级交易执行性能以及 AI 赋能的交易策略 - - 解决方案合作伙伴 Alpha
    的头像 发表于 10-11 08:10 440次阅读
    AMD 为超低时延电子交易推出 Alveo UL3524 <b class='flag-5'>加速卡</b>

    GPU加速卡对PCB性能的作用是什么?

    由于 AI 服务器需要处理大量的数据和信号,因此 GPU 加速卡需要使用 具有高频高速性能的 CCL,即能够在高频率下保持低损耗、低时延、低串扰、低噪声等 特性的 CCL。这需要 CCL 具有较低的介电常数(Dk)、介电损耗(D
    发表于 09-22 14:50 3399次阅读
    GPU<b class='flag-5'>加速卡</b>对PCB<b class='flag-5'>性能</b>的作用是什么?

    英伟通过GPU驱动程序提升Starfield性能

    英伟(Nvidia)正在推出一项更新,将为RTX 30和40系列的所有者提高Starfield的性能英伟
    的头像 发表于 09-14 16:37 832次阅读

    一种支持AI视频处理的高容量流媒体加速卡方案

    本次要和大家分享的是AMD近期推出的新一代多媒体视频加速卡,它主要应用于视频处理场景,我们内部将它称为异构加速卡,行业同仁更认可将其称作视频处理单元(VPU)。
    的头像 发表于 08-28 09:45 1037次阅读
    一种<b class='flag-5'>支持</b><b class='flag-5'>AI</b>视频处理的高容量流媒体<b class='flag-5'>加速卡</b>方案

    如何取替英伟?如何颠覆英伟

    随着生成式AI的火热以及英伟市值冲破万亿美元,如何取替英伟,成为
    的头像 发表于 07-10 11:21 1150次阅读
    如何取替<b class='flag-5'>英伟</b><b class='flag-5'>达</b>?如何颠覆<b class='flag-5'>英伟</b><b class='flag-5'>达</b>?