NVIDIA Blackwell平台带来性能跃升-电子发烧友网

Blackwell 完成的每一项测试，都为各项 AI 应用树立了训练性能新标杆。

对于使用文本、计算机代码、蛋白质链、摘要、视频甚至 3D 图形的生成式 AI 应用，它们需要数据中心规模的加速计算来高效地训练其背后的大语言模型（LLM）。

在 MLPerf Training 4.1 行业基准测试中，NVIDIA Blackwell 平台在所有参与测试的工作负载上都取得了令人赞叹的测试结果。在 LLM 基准测试中，每块 GPU 的性能提高了 2.2 倍，其中包括 Llama 2 70B 微调和 GPT-3 175B 预训练。

此外，NVIDIA 提交的 NVIDIA Hopper 平台测试结果继续在所有基准测试上保持了规模级的记录，包括使用 11,616 块 Hopper GPU 进行的 GPT-3 175B 基准测试。

Blackwell 带来性能跃升

这是 NVIDIA 首次向 MLCommons 联盟提交 Blackwell 的训练测试结果，其结果突显了该架构是如何提高生成式 AI 训练性能的。MLCommons 联盟为业内公司创建了标准化、公正且经过严格的同行评审的测试。

例如，Blackwell 架构包括新的核函数，它们可以更高效地使用 Tensor Core。这些核函数执行优化的专用数学运算，例如矩阵乘，是许多深度学习算法的主要计算。

Blackwell 拥有更高的每块 GPU 计算吞吐量以及更大、更快的高带宽内存，使其能够在更少的 GPU 上运行 GPT-3 175B 基准测试，同时实现出色的每块 GPU 性能。

通过利用容量更大、带宽更高的 HBM3e 内存，仅仅 64 块 Blackwell GPU 就能够运行 GPT-3 LLM 基准测试，并且不损失每块 GPU 性能。使用 Hopper 进行相同的基准测试时则需要 256 块 GPU。

在提交 Blackwell 的训练测试结果之前，NVIDIA 还提交了 MLPerf Inference 4.1 推理测试结果。在该测试中，Blackwell 的 LLM 推理性能比 Hopper 高出 4 倍。测试结果显示，通过利用 Blackwell 架构的 FP4 精度以及 NVIDIA QUASAR 量化系统，Blackwell 在满足基准测试的精度要求的同时展现出了强大的性能。

持续优化

经过持续的软件开发，NVIDIA 平台在各种框架、模型和应用的训练和推理方面获得了性能提升和功能改进。

在本轮提交的 MLPerf 训练测试结果中，当使用 GPT-3 175B 进行训练时，Hopper 的每块 GPU 训练性能比上次提交该基准测试时提高了 1.3 倍。

NVIDIA 还提交了 GPT-3 175B 基准测试的大规模测试结果，该测试使用了 11,616 块 Hopper GPU，这些 GPU 通过 NVIDIA NVLink 和 NVSwitch 高带宽 GPU 间通信以及 NVIDIA Quantum-2 InfiniBand 网络连接在一起。

自去年以来，NVIDIA Hopper GPU 在 GPT-3 175B 基准测试中的规模和性能提升了三倍多。此外，在 Llama 2 70B LoRA 微调基准测试中，NVIDIA 在使用相同数量的 Hopper GPU 的情况下将性能提高了 26%，这体现了软件方面的持续优化。

NVIDIA 持续优化加速计算平台的努力，使其 MLPerf 测试结果得以不断提升——提高了容器化软件的性能，为使用现有平台的合作伙伴和客户带来更强大的算力，并让他们从平台投资中获得更高的回报。

携手合作

NVIDIA 的合作伙伴——包括华硕、Azure、思科、戴尔、富士通、Giga Computing、Lambda Labs、联想、Oracle Cloud、云达科技和超微等系统制造商和云服务提供商——也在最新一轮 MLPerf 测试中提交了令人印象深刻的测试结果。

作为 MLCommons 的创始成员，NVIDIA 认为，行业标准的基准测试和基准测试最佳实践对于 AI 计算而言至关重要。通过获取经过同行评审、精简的 AI 和 HPC 各个平台的对比信息，企业可以跟上最新的 AI 计算创新步伐，并获得有助于指导其重大平台投资决策的关键数据。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
5107

浏览量
104465
gpu

gpu

+关注

关注
28

文章
4830

浏览量
129778
计算机

计算机

+关注

关注
19

文章
7575

浏览量
89098
LLM

LLM

+关注

关注
1

文章
308

浏览量
511

原文标题：巅峰的训练性能：Blackwell 在 MLPerf 测试中将训练性能带到新高度

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

Supermicro提高NVIDIA Blackwell机架级解决方案产量

Supermicro, Inc.，作为人工智能/机器学习、高性能计算、云、存储和5G/Edge领域的整体IT解决方案提供商，近日宣布其基于NVIDIA Blackwell平台加速的端对

发表于 02-11 09:45 •169次阅读

使用NVIDIA推理平台提高AI推理性能

NVIDIA推理平台提高了 AI 推理性能，为零售、电信等行业节省了数百万美元。

发表于 02-08 09:59 •323次阅读

使用<b class='flag-5'>NVIDIA</b>推理<b class='flag-5'>平台</b>提高AI推理<b class='flag-5'>性能</b>

MediaTek与NVIDIA携手设计GB10 Grace Blackwell超级芯片

MediaTek与NVIDIA近日宣布了一项重要合作，双方将共同设计NVIDIA GB10 Grace Blackwell超级芯片。这款超级芯片将被应用于NVIDIA的个人AI超级计算

发表于 01-13 10:48 •261次阅读

MediaTek与NVIDIA携手打造GB10 Grace Blackwell超级芯片

MediaTek近日正式宣布与NVIDIA携手合作，共同设计NVIDIA GB10 Grace Blackwell超级芯片。这款芯片将被应用于NVIDIA的个人AI超级计算机——

发表于 01-08 15:32 •439次阅读

Supermicro推出直接液冷优化的NVIDIA Blackwell解决方案

，宣布推出高性能的SuperCluster。这一端对端AI数据中心解决方案采用NVIDIA Blackwell平台，专为兆级参数规模的生成式AI时代所设计。全新SuperCluster

发表于 11-25 10:39 •582次阅读

Supermicro推出直接液冷优化的<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Blackwell</b>解决方案

NVIDIA向开放计算项目捐赠Blackwell平台设计

近日，在美国加利福尼亚州举行的 OCP 全球峰会上，NVIDIA 宣布已把 NVIDIA Blackwell 加速计算平台的一些基础元素捐赠给开放计算项目（OCP），并扩大

发表于 11-19 15:30 •335次阅读

NVIDIA未来1年的Blackwell订单已全部售罄

10月12日资讯显示，Blackwell无疑已成为NVIDIA历史上极为成功的产品典范，其市场需求量已攀升至前所未有的高峰。　　凭借在全球AI算力领域的领先地位，Blackwell吸引了微软、Meta、Oracle、Op

发表于 10-12 16:20 •753次阅读

NVIDIA 在 Hot Chips 大会展示提升数据中心性能和能效的创新技术

来源： NVIDIA 在此次大会期间举行的四场演讲中，NVIDIA 工程师详细介绍了 NVIDIA Blackwell 平台、新的液冷研究成

发表于 08-28 16:38 •473次阅读

<b class='flag-5'>NVIDIA</b> 在 Hot Chips 大会展示提升数据中心<b class='flag-5'>性能</b>和能效的创新技术

NVIDIA AI芯片Blackwell推迟发布引热议,公司强调Hopper需求强劲

据8月5日最新消息，NVIDIA新款AI芯片Blackwell因被曝存在设计缺陷而推迟发布的消息，迅速在业界引发了广泛讨论与关注。面对这一市场传闻，NVIDIA官方迅速作出回应，强调其旗舰产品

发表于 08-05 15:05 •664次阅读

英伟达Blackwell架构,行业首选

的半导体技术路径图，首度公开了即将面世的下一代芯片——Rubin平台，旨在接替现有的Blackwell。　　回顾过往，NVIDIA始终保持着每两年发布一次全新架构的传统，从2020年的Ampere

发表于 06-05 15:28 •814次阅读

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

人工智能模型在规模和复杂性上呈指数级增长，对先进计算能力和内存容量的需求变得至关重要。Blackwell图形处理器架构通过在性能和效率方面实现大幅跃升，解决了这些需求。 HGX B200 训练

发表于 05-13 17:16

超微电脑借助英伟达Blackwell架构，打造顶尖生成式AI系统

超微电脑Supermicro近日宣布，其全新一代人工智能系统已正式问世，该系统基于NVIDIA的革命性Blackwell架构，展现了前所未有的人工智能性能。该系列新品包括NVIDIA

发表于 03-25 10:27 •843次阅读

NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD™

NVIDIA 于太平洋时间 3 月 18 日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwell 超级芯片的 NVIDIA DGX Sup

发表于 03-21 09:49 •878次阅读

NVIDIA宣布推出NVIDIA Blackwell平台以赋能计算新时代

全新 Blackwell GPU、NVLink 和可靠性技术赋能万亿参数规模的 AI 模型

发表于 03-20 09:44 •729次阅读

NVIDIA 推出 Blackwell 架构 DGX SuperPOD，适用于万亿参数级的生成式 AI 超级计算

基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术，可将集群中 Grace Blackwell 超级芯片的数量扩展至数万个，通过 NVIDIA NVLink可将多

发表于 03-19 10:56 •530次阅读

搜索历史

NVIDIA Blackwell平台带来性能跃升

评论