NVIDIA 在 MLPerf 测试中将推理带到新高度-电子发烧友网

在最新 MLPerf 基准测试中，NVIDIA H100 和 L4 GPU 将生成式 AI 和所有其他工作负载带到了新的水平，Jetson AGX Orin 则在性能和效率方面都有所提升。

作为独立的第三方基准测试，MLPerf 仍是衡量 AI 性能的权威标准。自 MLPerf 诞生以来，NVIDIA 的 AI 平台在训练和推理这两个方面一直展现出领先优势，包括最新发布的 MLPerf Inference 3.0 基准测试。

NVIDIA 创始人兼首席执行官黄仁勋表示：“三年前我们推出 A100 时，AI 世界由计算机视觉主导。如今，生成式 AI 已经到来。”

“这正是我们打造 Hopper 的原因，其通过 Transformer 引擎专为 GPT 进行了优化。最新的 MLPerf 3.0 凸显了 Hopper 的性能比 A100 高出 4 倍。”

“下一阶段的生成式 AI 需要高能效的新的 AI 基础设施来训练大型语言模型。客户正在大规模采用 Hopper，以构建由数万颗通过 NVIDIA NVLink 和 InfiniBand 连接的 Hopper GPU 组成的 AI 基础设施。”

“业界正努力推动安全、可信的生成式 AI 取得新的进展。而 Hopper 正在推动这项重要的工作。”

最新 MLPerf 结果显示，NVIDIA 将从云到边缘的 AI 推理性能和效率带到了一个新的水平。

具体而言，在 DGX H100 系统中运行的 NVIDIA H100 Tensor Core GPU 在每项 AI 推理测试（即在生产中运行神经网络）中均展现出最高的性能。得益于软件优化，该 GPU 在 9 月首次亮相时就实现了高达 54%的性能提升。

针对医疗领域，H100 GPU 在 3D-UNet（MLPerf 医学影像基准测试）中的性能相比 9 月提高了 31%。

在 Transformer 引擎的加持下，基于 Hopper 架构的 H100 GPU 在 BERT 上的表现十分优异。BERT 是一个基于 transformer 的大型语言模型，它为如今已经得到广泛应用的生成式 AI 奠定了基础。

生成式 AI 使用户可以快速创建文本、图像、3D 模型等。从初创公司到云服务提供商，企业都在迅速采用这一能力，以实现新的业务模式和加速现有业务。

数亿人现在正在使用 ChatGPT（同样是一个 transformer 模型）等生成式 AI 工具，以期得到即时响应。

在这个 AI 的 iPhone 时刻，推理性能至关重要。深度学习的部署几乎无处不在，这推动了从工厂车间到在线推荐系统等对推理性能的无尽需求。

L4 GPU 精彩亮相

NVIDIA L4 Tensor Core GPU 在本次 MLPerf 测试中首次亮相，其速度是上一代 T4 GPU 的 3 倍以上。这些加速器具有扁平的外形，可在几乎所有的服务器中提供高吞吐量和低延迟。

L4 GPU 运行了所有 MLPerf 工作负载。凭借对关键的 FP8 格式的支持，其在对性能要求很高的 BERT 模型上取得了非常惊人的结果。

除了出色的 AI 性能外，L4 GPU 的图像解码速度快了 10 倍，视频处理速度快了 3.2 倍，同时图形和实时渲染性能提高了 4 倍以上。

这些加速器两周前在 GTC 上发布并已通过各大系统制造商和云服务提供商提供。L4 GPU 是 NVIDIA 在 GTC 上发布的 AI 推理平台产品组合中的最新成员。

软件和网络在系统测试中大放异彩

NVIDIA 的全栈式 AI 平台在一项全新 MLPerf 测试中展现了其领先优势。

被称之为 Network-division 的基准测试将数据传输至一个远程推理服务器。它反映了企业用户将数据存储在企业防火墙后面、在云上运行 AI 作业的热门场景。

在 BERT 测试中，远程 NVIDIA DGX A100 系统提供高达 96%的最大本地性能，其性能下降的原因之一是因为它们需要等待 CPU 完成部分任务。在单纯依靠 GPU 进行处理的 ResNet-50 计算机视觉测试中，它们达到了 100%的性能。

这两个结果在很大程度上要归功于 NVIDIA Quantum InfiniBand 网络、NVIDIA ConnectX SmartNIC 以及 NVIDIA GPUDirect 等软件。

Orin 在边缘的性能提升 3.2 倍

另外，相较于一年前的结果，NVIDIA Jetson AGX Orin 模块化系统的能效提高了 63%，性能提高了 81%。Jetson AGX Orin 可在需要 AI 的狭小空间内以低功率进行推理，包括在由电池供电的系统上。

专为需要更小模块、更低功耗的应用而开发的 Jetson Orin NX 16G 在本次基准测试中首次亮相便大放异彩。其性能是上一代 Jetson Xavier NX 处理器的 3.2 倍。

广泛的 NVIDIA AI 生态

MLPerf 结果显示，NVIDIA AI 得到了业内最广泛的机器学习生态系统的支持。

在这一轮测试中，有十家公司在 NVIDIA 平台上提交了结果，包括华硕、戴尔科技、技嘉、新华三、联想、宁畅、超微和超聚变等系统制造商和微软 Azure 云服务。

他们所提交的结果表明，无论是在云端还是在自己的数据中心运行的服务器中，用户都可以通过 NVIDIA AI 获得出色的性能。

NVIDIA 的众多合作伙伴也参与了 MLPerf，因为他们知道这是一个帮助客户评估 AI 平台和厂商的很有价值的工具。最新一轮结果表明，他们今天所提供的性能将随着 NVIDIA 平台的发展而不断提升。

用户需要的是“多面手”

NVIDIA AI 是唯一能够在数据中心和边缘计算中运行所有 MLPerf 推理工作负载和场景的平台。其全面的性能和效率让用户能够成为真正的赢家。

用户在实际应用中通常会采用许多不同类型的神经网络，这些网络往往需要实时提供答案。

例如，一个 AI 应用可能需要先理解用户的语音请求，对图像进行分类、提出建议，然后以人声作为语音来回答用户。每个步骤都需要用到不同类型的 AI 模型。

MLPerf 基准测试涵盖了这些以及其他流行的 AI 工作负载，所以这些测试能够确保 IT 决策者获得可靠且可以灵活部署的性能。

用户可以根据 MLPerf 的结果做出明智的购买决定，因为这些测试是透明的、客观的。该基准测试得到了包括 Arm、百度、Facebook AI、谷歌、哈佛大学、英特尔、微软、斯坦福大学和多伦多大学在内的广泛支持。

可以使用的软件

NVIDIA AI 平台的软件层 NVIDIA AI Enterprise 确保用户能够从他们的基础设施投资中获得最佳的性能以及在企业数据中心运行 AI 所需的企业级支持、安全性和可靠性。

这些测试所使用的所有软件都可以从 MLPerf 库中获得，因此任何人都可以获得这些领先的结果。

各项优化措施不断地被整合到 NGC（NVIDIA 的 GPU 加速软件目录）上的容器中。本轮测试中提交的每项工作均使用了该目录中的 NVIDIA TensorRT 优化 AI 推理性能。

扫描海报二维码，或点击“阅读原文”，即可观看 NVIDIA 创始人兼首席执行官黄仁勋 GTC23 主题演讲重播！

原文标题：NVIDIA 在 MLPerf 测试中将推理带到新高度

文章出处：【微信公众号：NVIDIA英伟达】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英伟达

英伟达

+关注

关注
22

文章
3888

浏览量
92551

原文标题：NVIDIA 在 MLPerf 测试中将推理带到新高度

文章出处：【微信号：NVIDIA_China，微信公众号：NVIDIA英伟达】欢迎添加关注！文章转载请注明出处。

英伟达GTC25亮点：NVIDIA Blackwell Ultra 开启 AI 推理新时代

英伟达GTC25亮点：NVIDIA Blackwell Ultra 开启 AI 推理新时代

发表于 03-20 15:35 •306次阅读

英伟达GTC25亮点：NVIDIA Dynamo开源库加速并扩展AI推理模型

NVIDIA Dynamo 提高了推理性能，同时降低了扩展测试时计算 (Scaling Test-Time Compute) 的成本；在 NVIDI

发表于 03-20 15:03 •314次阅读

精准降噪，智控未来——振动噪声测试仪LMS赋能工业智造新高度

在工业设备高速发展的今天，振动与噪声问题已成为影响产品性能、用户体验及市场竞争力的关键因素。无论是新能源汽车电机异响、家电设备运行噪音，还是航空航天精密仪器的振动超标，高效精准的测试与分析技术是突破

发表于 03-20 10:36 •90次阅读

黑芝麻智能引领人形机器人技术迈向新高度

，基于黑芝麻智能领先的芯片及算法方案，致力于为“天问”赋予更强大的智能“大脑”与“小脑”。同时，双方也正在围绕人形机器人量产的芯片解决方案展开深入合作，共同引领人形机器人技术迈向新高度。

发表于 03-12 18:00 •387次阅读

海伯森技术推动机器人感知能力迈向新高度

的“感知神经元”，公司自主研发的六维力扭矩传感器已批量应用于20余家头部机器人企业，为人形机器人、协作机器人及高端工业场景提供克级力控精度，推动机器人感知能力迈向新高度。

发表于 03-10 11:07 •283次阅读

使用NVIDIA推理平台提高AI推理性能

NVIDIA推理平台提高了 AI 推理性能，为零售、电信等行业节省了数百万美元。

发表于 02-08 09:59 •385次阅读

忆联企业级测试验证平台介绍

在SSD产品从概念设计到市场投放的复杂过程中，产品测试验证环节不仅是确保产品质量的坚固防线，更是推动SSD性能迈向新高度的核心驱动力。

发表于 01-23 18:19 •460次阅读

锂电池充放电老化柜：技术创新引领新能源产业质量检测新高度

设备，正以其技术创新引领新能源产业质量检测的新高度，成为行业内的热点话题。技术革新，提升检测精度与效率锂电池充放电老化柜是一种专门用于对锂电池进行充放电老化测试和评估的设备。它通过模拟电池在实际使用中的

发表于 01-16 16:53 •188次阅读

解锁光伏发电新高度：探秘 400V 转 660V 升压变压器核心力量

解锁光伏发电新高度：探秘 400V 转 660V 升压变压器核心力量在追求绿色能源变革的征程中，光伏发电已然成为耀眼的明星，而 400V 转 660V 升压变压器则是隐藏在幕后、默默发力的关键

发表于 12-27 10:27 •271次阅读

智能数显，掌控压力新高度

行业资讯

shchuanganqi
发布于 :2024年11月18日 10:03:34

浪潮信息AS13000G7荣获MLPerf™ AI存储基准测试五项性能全球第一

众，在3D-UNet和CosmoFlow两个模型共计八项测试中，斩获五项冠军。 MLPerf™ Storage v1.0 AI存储基准测试成绩 ML

发表于 09-28 16:46 •307次阅读

英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服务和 NVIDIA NIM 推理微服务，与同样刚推出的 Llama 3.1 系列开源模型一起，为全球企业的生成式 AI

发表于 07-25 09:48 •866次阅读

激光雷达-定义未来感知的新高度

保护装置

jf_18500570
发布于 :2024年06月22日 10:21:14

ZR执行器：智能制造的得力干将，提升生产新高度

ZR执行器：智能制造的得力干将，提升生产新高度 ZR执行器以其精准的控制能力和高效的执行效率，在智能制造领域发挥了重要作用。传统的执行器往往存在控制不精确、反应速度慢等问题，难以满足现代生产对于高效

发表于 05-10 11:15 •705次阅读

利用NVIDIA组件提升GPU推理的吞吐

本实践中，唯品会 AI 平台与 NVIDIA 团队合作，结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）将推理的稠密网络和热

发表于 04-20 09:39 •910次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

NVIDIA 在 MLPerf 测试中将推理带到新高度

评论

英伟达GTC25亮点：NVIDIA Blackwell Ultra 开启 AI 推理新时代

英伟达GTC25亮点：NVIDIA Dynamo开源库加速并扩展AI推理模型

精准降噪，智控未来——振动噪声测试仪LMS赋能工业智造新高度

黑芝麻智能引领人形机器人技术迈向新高度

海伯森技术推动机器人感知能力迈向新高度

使用NVIDIA推理平台提高AI推理性能

忆联企业级测试验证平台介绍

锂电池充放电老化柜：技术创新引领新能源产业质量检测新高度

解锁光伏发电新高度：探秘 400V 转 660V 升压变压器核心力量

智能数显，掌控压力新高度

浪潮信息AS13000G7荣获MLPerf™ AI存储基准测试五项性能全球第一

英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

激光雷达-定义未来感知的新高度

ZR执行器：智能制造的得力干将，提升生产新高度

利用NVIDIA组件提升GPU推理的吞吐