NVIDIA为需要加速计算的企业客户运行测试服务器-电子发烧友网

借助 NVIDIA AI，戴尔、浪潮、Microsoft Azure 和 Supermicro 在今天发布的新 MLPerf 基准测试中创下快速训练 AI 模型的记录

看看谁刚刚在快速训练 AI 模型方面创下新速度记录：戴尔科技、浪潮、Supermicro以及在 MLPerf 基准测试中首次亮相的 Azure 均在使用 NVIDIA AI。

在今天宣布的 MLPerf 训练 1.1 结果中，NVIDIA平台在所有八个热门工作负载中都创下了记录。

图示：在新一轮的测试中，NVIDIA AI 训练所有模型的速度都快于替代方案

NVIDIA A100 Tensor Core GPU 提供了最出色每芯片性能， Selene 是NVIDIA内部基于模块化NVIDIA DGX SuperPOD架构构建的AI超级计算机，借助NVIDIA InfiniBand网络和NVIDIA软件栈进行扩展，A100在Selene上实现了最快的AI训练速度。

图示：NVIDIA A100 GPU 在所有八项 MLPerf 1.1 测试中均实现最好的每芯片训练性能

云服务更上一层楼

根据最新结果，在训练 AI 模型方面，Azure 的 NDm A100 v4 实例的速度遥遥领先。它运行了新一轮的每项测试，扩展到多达 2，048 个 A100 GPU。

Azure 不仅展示了出色性能，而且在美国的六个地区，现在所有人都可以租借和使用其出色性能。

AI 训练是一项需要大量投入的大型工作。NVIDIA希望用户借助他们选择的服务或系统以创纪录的速度训练模型。

因此，NVIDIA将 NVIDIA AI 与面向云服务、主机托管服务、企业和科学计算中心的产品相结合。

服务器制造商各显身手

在OEM 中，浪潮凭借其八路GPU服务器NF5688M6 和NF5488A5液冷服务器在单节点性能方面创下了最多记录。戴尔和 Supermicro 在四路 A100 GPU 系统上创下了记录。

共有 10 家 NVIDIA 合作伙伴提交了本轮测试结果，其中包含 8 家 OEM 和 2 家云服务提供商。它们占所有提交的 90% 以上。

这是 NVIDIA 生态系统在 MLPerf 训练测试中的第五次亮相，也是到目前为止最出色的亮相。

NVIDIA的合作伙伴之所以积极参与，是因为他们知道 MLPerf 是唯一符合行业标准、经过同行评审的 AI 训练和推理基准测试。对于评估 AI 平台和供应商的客户来说，这是一个有价值的工具。

为速度认证的服务器

百度 PaddlePaddle、戴尔科技、富士通、技嘉科技、慧与、浪潮、联想和 Supermicro 提交了基于本地数据中心的结果（单节点和多节点任务）。

NVIDIA几乎所有的 OEM 合作伙伴都在 NVIDIA 认证系统上运行了测试，NVIDIA为需要加速计算的企业客户验证了服务器。

提交的范围展示了 NVIDIA 平台的广度和成熟度，该平台为各种规模的企业提供最佳的解决方案。

既快速又灵活

NVIDIA AI 是唯一用于提交所有基准测试和用例的平台参与者，这展示了其通用性和高性能。快速灵活的系统提供客户所需的生产力，以加快他们的工作速度。

AI训练基准测试涵盖当今最热门的八个 AI 工作负载和场景，例如计算机视觉、自然语言处理、推荐系统、增强学习等。

MLPerf 测试透明、客观，因此用户可以依靠结果做出明智的购买决策。该行业基准测试组织成立于 2018 年 5 月，得到阿里巴巴、ARM、Google、Intel 和 NVIDIA 等数十家行业领先公司的支持。

三年内加速 20 倍

回顾过去，数据显示，仅在过去 18 个月，NVIDIA A100 GPU 的性能就提升了 5 倍以上。这要归功于软件的持续创新，这也是NVIDIA目前工作的重心。

自从三年前 MLPerf 测试首次亮相，NVIDIA 的性能提高了 20 倍以上。这种大规模加速源于NVIDIA在全栈 GPU、网络、系统和软件方面取得的进步。

图示：NVIDIA AI 在三年内实现了 20 倍以上的改进

持续改进软件

NVIDIA的新进展来自多项软件改进。

例如，借助一类新的内存复制操作，NVIDIA在针对医学成像的 3D-UNet 基准测试中实现 2.5 倍的操作加速。

得益于微调 GPU 以进行并行处理的方式，NVIDIA在针对物体检测的 Mask R-CNN 测试中实现 10% 的速度提升，而在针对推荐系统的测试中实现了 27% 的提升。NVIDIA只是重叠了独立操作，这种技术尤其适合跨多个 GPU 运行的作业。

NVIDIA扩展了 CUDA 图形的使用范围，尽可能减少与主机 CPU 的通信。得益于此，NVIDIA在针对图像分类的 ResNet-50 基准测试中实现了 6% 的性能提升。

NVIDIA在NCCL 上实施了两种新技术。NCCL 是NVIDIA的库，用于优化 GPU 之间的通信。对于 BERT 等大型语言模型，这样可以将结果加速高达 5%。

利用NVIDIA的工作结果

NVIDIA使用的所有软件均在 MLPerf 仓库提供，因此每个人都可以获得NVIDIA的出色结果。NVIDIA不断将这些优化整合到 NGC（NVIDIA的 GPU 应用程序软件中心）上的容器。

它是全栈平台的一部分，已在新的行业基准测试中得到验证，可从各种合作伙伴处获得，能够处理当今真正的 AI 作业。

原文标题：MLPerf | 云服务、OEM 借助 NVIDIA AI 让 AI 训练更上层楼

文章出处：【微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

审核编辑：彭菁

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
5104

浏览量
104392
服务器

服务器

+关注

关注
12

文章
9415

浏览量
86459
数据中心

数据中心

+关注

关注
16

文章
4951

浏览量
72645

原文标题：MLPerf | 云服务、OEM 借助 NVIDIA AI 让 AI 训练更上层楼

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

云服务器需要网络吗？怎么设置

需要。云服务器的运行依赖于网络连接，以确保用户能够通过互联网远程访问和管理服务器资源。网络设置是云服务器配置过程中的重要环节，它涉及到IP地

发表于 02-21 10:25 •110次阅读

利用NVIDIA DPF引领DPU加速云计算的未来

越来越多的企业开始采用加速计算，从而满足生成式 AI、5G 电信和主权云的需求。NVIDIA 推出了 DOCA 平台框架（DPF)，该框架提供了基础构建模块来释放

发表于 01-24 09:29 •301次阅读

利用<b class='flag-5'>NVIDIA</b> DPF引领DPU<b class='flag-5'>加速</b>云<b class='flag-5'>计算</b>的未来

云服务器 Flexus X 实例，镜像切换与服务器压力测试

云服务器 Flexus X 压力测试 1、购买华为云 Flexus X 实例 Flexus云服务器X实例-华为云 (huaweicloud.com) 2、xshell 远程连接服务器

发表于 01-03 09:23 •210次阅读

GPU加速云服务器怎么用的

GPU加速云服务器是将GPU硬件与云计算服务相结合，通过云服务提供商的平台，用户可以根据需求灵活租用带有GPU资源的虚拟机实例。那么，GPU

发表于 12-26 11:58 •181次阅读

云服务器 Flexus X 实例 MySQL 应用加速测试

文章目录目录文章目录购买配置基本配置参考如下：连接服务器 查询MySQL状态启动MySQL 添加配置添加密码并修改权限性能测试 C#插入数据测试

发表于 12-24 12:19 •267次阅读

《CST Studio Suite 2024 GPU加速计算指南》

许可证模型的加速令牌或SIMULIA统一许可证模型的SimUnit令牌或积分授权。 4. GPU计算的启用 - 交互式模拟：通过加速对话框启用，打开求解器对话框，点击“

发表于 12-16 14:25

NVIDIA加速计算如何推动医疗健康

近日，NVIDIA 企业平台副总裁 Bob Pette 在 AI Summit 一场演讲中重点谈论了 NVIDIA 加速计算如何推动医疗健康

发表于 11-20 09:10 •417次阅读

日本企业借助NVIDIA产品加速AI创新

日本领先企业和大学正在使用 NVIDIA NeMo、NIM 微服务和 NVIDIA Isaac 加速 AI 创新。

发表于 11-19 14:34 •534次阅读

如何测试SMTP服务器功能

在开始测试SMTP服务器功能之前，了解其重要性是关键。SMTP服务器是电子邮件系统的核心，负责邮件的发送和接收。如果SMTP服务器出现问题，可能会导致邮件延迟、丢失或无法发送，影响

发表于 10-30 17:31 •1147次阅读

SEO使用站群服务器租用需要考虑哪些?

在SEO（搜索引擎优化）的背景下，站群服务器是一种运行多个网站的特殊服务器，每个网站共享同一个IP地址，但也可拥有独立IP。下面将详细探讨SEO使用站群服务器租用

发表于 08-26 13:23 •232次阅读

企业单位为什么需要NTP网络时间服务器？

1、企业使用NTP网络时间服务器是为了获得精确的时间企业使用NTP网络时间服务器是为了确保其计算机网络中的所有设备都具有精确的时间。NTP

发表于 07-10 14:33 •414次阅读

如何同时在ESP8266上运行TCP客户端和TCP服务？

客户端无法连接到 TCP 服务器。如果不将 TCP 客户端从 ESP 连接到云服务器，则 ESP 上的 TCP 服务器可以很好地接受 TC

发表于 07-08 08:26

接口测试怎么测多个服务器连接

接口测试是软件开发过程中的一个重要环节，用于验证系统组件之间的交互是否符合预期。在多服务器环境中，接口测试的复杂性会增加，因为需要考虑服务器

发表于 05-30 15:16 •537次阅读

华为云函数工作流：引领未来无服务器计算时代

在当今数字化飞速发展的时代，企业和个人对于计算资源的需求越来越高，但传统的服务器架构带来的管理成本和资源浪费问题也愈发凸显。为解决这一难题，华为云引领着无

发表于 05-27 10:50 •441次阅读

企业在选择大带宽服务器时需要考虑哪些其他因素?

企业在选择大带宽服务器时，除了成本因素，还需要考虑哪些因素，rak部落小编为您整理发布企业在选择大带宽服务器时

发表于 04-12 10:31 •428次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

NVIDIA为需要加速计算的企业客户运行测试服务器

评论

云服务器需要网络吗？怎么设置

利用NVIDIA DPF引领DPU加速云计算的未来

云服务器 Flexus X 实例，镜像切换与服务器压力测试

GPU加速云服务器怎么用的

云服务器 Flexus X 实例 MySQL 应用加速测试

《CST Studio Suite 2024 GPU加速计算指南》

NVIDIA加速计算如何推动医疗健康

日本企业借助NVIDIA产品加速AI创新

如何测试SMTP服务器功能

SEO使用站群服务器租用需要考虑哪些?

企业单位为什么需要NTP网络时间服务器？

如何同时在ESP8266上运行TCP客户端和TCP服务？

接口测试怎么测多个服务器连接

华为云函数工作流：引领未来无服务器计算时代

企业在选择大带宽服务器时需要考虑哪些其他因素?