NVIDIA 与飞桨团队合作开发基于 ResNet50 的模型示例-电子发烧友网

你还在头疼于经典模型的复现吗？不知何处可以得到全面可参照的 Benchmark？

为了让飞桨开发者可以快速复现顶尖的精度和超高的性能，NVIDIA 与飞桨团队合作开发了基于 ResNet50 的模型示例，并将持续开发更多的基于 NLP 和 CV 等领域的经典模型，后续陆续发布的模型有 BERT、PP-OCR、PP-YOLO 等，欢迎持续关注。

深度学习模型是什么？

深度学习包括训练和推理两个环节。训练是指通过大数据训练出一个复杂的神经网络模型，即用大量标记过的数据来“训练”相应的系统，使之可以适应特定的功能。推理是指利用训练好的模型，使用新数据推理出各种结论。深度学习模型是在训练工作过程中生成，并将其保存，用于推理当中。

深度学习训练推理示意图

NVIDIA Deep Learning Examples

全新上线飞桨 ResNet50

NVIDIA Deep Learning Examples 仓库上线了基于飞桨实现的 ResNet50 模型的性能优化结果，该示例全面适配各类 NVIDIA GPU 和各种硬件拓扑（单机单卡，单机多卡），极致优化性能。值得一提的是，Deep Learning Examples 中飞桨 ResNet50 模型训练速度已超过对应的 PyTorch 版 ResNet50。

NVIDIA Deep Learning Examples 仓库中基于飞桨与 PyTorch 的 ResNet50 模型在同等 GPU 配置下的训练性能比较，GPU 配置为 NVIDIA DGX A100（8x A100 80GB）。

*数据来源：［1］［2］

NVIDIA Deep Learning Examples 仓库中飞桨 ResNet50 有哪些优势？

优势一：通过使用 DALI 等工具，加速 GPU 数据预处理性能

NVIDIA Data Loading Library（ DALI ）专注于使用 GPU 加速深度学习应用中的数据加载和预处理。深度学习数据预处理涉及到复杂的、多个阶段的处理过程，如 ResNet50 模型训练过程中，在 CPU 上处理图片的加载、解码、裁剪、翻转、缩放和其他数据增强等操作会成为瓶颈，限制训练和推理的性能和可扩展性。DALI 将这些操作转移到 GPU 上，最大限度地提高输入流水线的吞吐量，并且其中数据预取，并行执行和批处理的操作对用户是透明的。

优势二：通过使用 AMP，ASP 等工具，提高推理性能

飞桨内置支持 AMP（自动混合精度）及 ASP（自动稀疏化）模块，AMP 模块可在模型训练过程中，自动为算子选择合适的计算精度（FP32/FP16），充分利用 Tensor Cores 的性能，在不影响模型精度的前提下，大幅加速模型训练。

ASP 模块实现了一个工作流将深度学习模型从稠密修剪为 2：4 的稀疏模式，经过重训练之后，可恢复到与稠密模型相当的精度。稀疏模型可以充分利用 A100 Tensor Core GPU 的加速特性，被修剪的权重矩阵参数存储量减半，并且可以获得理论上 2 倍的计算加速，从而大幅提高推理性能。

优势三：通过集成 TensorRT，优化推理模型

飞桨推理集成了 TensorRT，称为 Paddle-TRT。它可以把部分模型子图交给 TensorRT 加速，而其他部分仍然用飞桨执行，从而达到最佳的推理性能。

优势四：丰富的 Benchmark

NVIDIA Deep Learning Examples 仓库中

有哪些 Benchmark？

NVIDIA Deep Learning Examples 仓库中的 Benchmark 主要包含训练精度结果、训练性能结果、推理性能结果、Paddle-TRT 性能结果几个方面。

1、训练精度结果

训练精度： NVIDIA DGX A100 （8x A100 80GB）

*数据来源：［1］

集成 ASP 的提高精度： NVIDIA DGX A100 （8x A100 80GB）

*数据来源：［1］

2、训练性能结果

训练性能： NVIDIA DGX A100 （8x A100 80GB）

*数据来源：［1］

集成 ASP 的训练性能： NVIDIA DGX A100 （8x A100 80GB）

*数据来源：［1］

3、推理性能结果

推理性能： NVIDIA DGX A100 （1x A100 80GB）

*数据来源：［1］

4、Paddle-TRT 性能结果

Paddle-TRT 性能结果： NVIDIA DGX A100 （1x A100 80GB）

*数据来源：［1］

Paddle-TRT 性能结果： NVIDIA A30 （1x A30 24GB）

*数据来源：［1］

Paddle-TRT 性能结果： NVIDIA A10 （1x A10 24GB）

*数据来源：［1］

如何下载 NVIDIA Deep Learning Examples 中的飞桨 ResNet50？

NVIDIA Deep Learning Examples 飞桨 ResNet50 下载页面

飞桨容器如何安装？

容器包含了深度学习框架在运行时所需的所有部件（包括驱动，工具包等），它具有轻量化与可复制性、打包和执行环境合二为一以及简化应用程序部署等优势，因此，被认为是在同一环境中实现“构建、测试、部署”的最佳平台。容器允许我们创建标准化可复制的轻量级开发环境，摆脱来自 Hypervisor 所带来运行开销。应用程序可以基于 Container Runtime 运行在“任意”系统中。

NVIDIA 与百度飞桨联合开发了 NGC 飞桨容器，将最新版本的飞桨与最新的 NVIDIA 的软件栈进行了无缝的集成与性能优化，最大程度的释放飞桨框架在 NVIDIA 最新硬件上的计算能力。这样，用户不仅可以快速开启 AI 应用，专注于创新和应用本身，还能够在 AI 训练和推理任务上获得飞桨+NVIDIA 带来的飞速体验。

NGC 飞桨容器已经集成入飞桨官网主页。你可以选择 “飞桨版本”+“Linux”+“Docker”+“CUDA 11.7”找到对应的 Container 下载指令。

并参考《NGC 飞桨容器安装指南》下载安装：https://www.paddlepaddle.org.cn/documentation/docs/zh/install/install_NGC_PaddlePaddle_ch.html

运行结果如下：

审核编辑：彭静

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4929

浏览量
102791
模型

模型

+关注

关注
1

文章
3158

浏览量
48701
大数据

大数据

+关注

关注
64

文章
8862

浏览量
137279
飞桨

飞桨

+关注

关注
0

文章
33

浏览量
2277

原文标题：NVIDIA Deep Learning Examples飞桨ResNet50模型上线训练速度超PyTorch ResNet50

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

在Ubuntu 24.04 LTS上安装飞桨PaddleX

了众多开箱即用的预训练模型，可以实现模型从训练到推理的全流程开发，支持国内外多款主流硬件，助力AI 开发者进行产业实践。本文将介绍在Ubuntu 24.04.1LTS上从零开始安

发表于 11-11 17:45 •116次阅读

在Ubuntu 24.04 LTS上安装<b class='flag-5'>飞</b><b class='flag-5'>桨</b>PaddleX

基于改进ResNet50网络的自动驾驶场景天气识别算法

摘要：为了充分利用自动驾驶汽车路测图像数据，增加行驶过程中对天气情况识别的准确性，提出了一种基于改进ResNet50网络的自动驾驶场景天气识别算法。该算法将SE模块与ResNet50网络相结合，通过

发表于 11-09 11:14 •820次阅读

基于改进<b class='flag-5'>ResNet50</b>网络的自动驾驶场景天气识别算法

凌智电子加入飞桨技术伙伴计划，携手PaddleX为视觉模组产品赋能添“智”

近日，福州市凌睿智捷电子有限公司（以下简称凌智电子）正式加入飞桨技术伙伴计划。双方将共同探索人工智能技术在边缘端部署中的创新与应用。凌智电子将凭借其在边缘计算领域的丰富经验，结合飞桨低

发表于 11-01 08:07 •198次阅读

凌智电子加入<b class='flag-5'>飞</b><b class='flag-5'>桨</b>技术伙伴计划，携手PaddleX为视觉模组产品赋能添“智”

NVIDIA拟与印度合作开发AI芯片

近日，据媒体报道，全球领先的图形处理器制造商NVIDIA提出了与印度合作开发人工智能芯片的计划。此举旨在充分利用印度丰富的半导体设计人才资源，并深入拓展当地日益增长的市场。 NVIDIA的这一

发表于 10-24 11:17 •455次阅读

NVIDIA Modulus助力风阻预测模型实现

NVIDIA 与百度飞桨双方技术团队通过在数据、算法、模型等多个方面的合作，共同打造了一款适用于

发表于 08-23 17:10 •836次阅读

TI (德州仪器) 团队到访飞凌嵌入式总部，深化交流与合作

7月10日，TI (德州仪器) Sitara MPU业务负责人及TI中国区技术业务团队一行来到飞凌嵌入式保定总部进行交流，与飞凌嵌入式的企业负责人以及技术和产品团队进行了会谈。双方就产

发表于 07-12 15:29 •910次阅读

NVIDIA与百度飞桨携手革新汽车风阻预测:DNNFluid-Car模型的崛起

在追求更高效、更环保的汽车设计浪潮中，NVIDIA与百度飞桨携手突破传统界限，共同研发了一款革命性的3D高精度汽车风阻预测模型——DNNFluid-Car。这款

发表于 07-09 14:56 •1521次阅读

百度发布文心大模型4.0 Turbo与飞桨框架3.0,引领AI技术新篇章

SUMMIT深度学习开发者大会2024上，向世界展示了百度在AI领域的最新成果——文心大模型4.0 Turbo和飞桨框架3.0，并详细披露了飞

发表于 06-29 16:03 •591次阅读

NVIDIA与Google DeepMind合作推动大语言模型创新

支持 NVIDIA NIM 推理微服务的谷歌最新开源模型 PaliGemma 首次亮相。

发表于 05-16 09:44 •421次阅读

科大讯飞与华中师范大学合作大模型赋能教育

科大讯飞与华中师范大学合作大模型赋能教育日前华中师范大学与科大讯飞股份有限公司签署战略合作协议；双方将围绕大

发表于 04-15 15:12 •807次阅读

技术团队们合作开发低温电路

富士通（Fujitsu）与 QuTech 合作开发了被称作 "世界首创"的低温电子电路，用于控制基于金刚石的量子比特。这项新技术在保持高质量性能的同时，解决了量子比特冷却过程中的 "线路瓶颈

发表于 03-13 12:36 •346次阅读

NVIDIA 第九届 Sky Hackathon 优秀作品展示 | 静语画韵：艺术中的无声诗篇

使用 NVIDIA Jetson 平台，亲身体验了大模型在图像识别和生成式模型调用方面的应用。从 Resnet50 模型的优化到 Tenso

发表于 12-21 19:35 •844次阅读

不要错过！NVIDIA “大模型没那么泛！”主题活动

2024 新年首发！ NVIDIA 大模型日系列活动将于 2024 年 1 月正式启动，由 NVIDIA 和业界专家携手分享大模型应用开发

发表于 12-20 19:35 •625次阅读

紫光展锐T820与百度飞桨完成I级兼容性测试助推端侧AI融合创新

的阶段性成果。本次I级兼容性测试完成了计算机视觉技术领域3个模型的验证，经过双方联合严格测试，紫光展锐T820在MobileNet-V1、ResNet50、SSD-MobileNet-V1模型上的精度、速度等各方面表现满足要求

发表于 12-14 16:35 •379次阅读

NVIDIA 为部分大型亚马逊 Titan 基础模型提供训练支持

本文将介绍亚马逊如何使用 NVIDIA NeMo 框架、GPU 以及亚马逊云科技的 EFA 来训练其最大的新一代大语言模型（LLM）。大语言模型的一切都很庞大——巨型模型是在数千颗

发表于 11-29 21:15 •513次阅读