WAVE SUMMIT+2022 大会回顾，NVIDIA 极致性能赋能飞桨落地千行百业-电子发烧友网

11 月 30 日，由深度学习技术及应用国家工程研究中心主办、百度飞桨承办的 WAVE SUMMIT+ 2022 深度学习开发者峰会圆满落幕。

本次峰会上，百度 AI 技术生态总经理马艳军发布了飞桨开源框架 2.4 版本，并携手 NVIDIA 等 12 家生态伙伴发布了飞桨生态发行版，为开发者提供更好的软硬一体化体验。

作为飞桨的深度合作伙伴，NVIDIA 也出席了这场盛大的线上峰会。NVIDIA 亚太区资深产品负责人 Adam Zheng 还带来了以“NVIDIA 全新一代产品，极致性能赋能飞桨落地千行百业”为主题的分享。以下为内容概要。

NVIDIA 推出 Hopper 架构

掀起新一代加速计算浪潮

NVIDIA 作为计算加速行业的领导者，正在通过全栈创新推动高性能计算的发展。从芯片和系统，到它们运行的算法和应用程序，NVIDIA 平台将 AI 带入了全球最大的行业，提供包括推荐系统、AR、VR、自动驾驶汽车等解决方案，并加速科学研究。

今年春季 GTC 大会上，NVIDIA 发布了 Hopper 全新一代 GPU 架构，提供了六项突破性创新（如上图）：

一、世界上最先进的芯片。由 800 亿个晶体管构建而成，这些晶体管采用了专为 NVIDIA 加速计算需求设计的尖端的 TSMC 4N 工艺，因而能够显著提升 AI、HPC、显存带宽、互连和通信的速度，并能够实现近 5TB/s 的外部互联带宽。此外，该款芯片也是首款支持 PCIe 5.0 的 GPU，也是首款采用 HBM3 的 GPU，可实现 3TB/s 的显存带宽。20 个芯片便可承载相当于全球互联网的流量，使其能够帮助客户推出先进的推荐系统以及实时运行数据推理的大型语言模型。

二、新的 Transformer 引擎——Transformer 现在已成为自然语言处理的标准模型方案，也是深度学习模型领域最重要的模型之一。新的 Transformer 引擎，可以将这些网络的速度提升至上一代的六倍，而不会损失精度。

三、第二代安全多实例 GPU —— MIG 技术支持将单个 GPU 分为七个更小且完全隔离的实例，以处理不同类型的作业。与上一代产品相比，在云环境中 Hopper 架构通过为每个 GPU 实例提供安全的多租户配置。

四、机密计算——全球首款具有机密计算功能的加速器，可保护 AI 模型和正在处理的客户数据。客户还可以将机密计算应用于医疗健康和金融服务等隐私敏感型行业的学习，也可以应用于共享云基础设施。

五、第 4 代 NVIDIA NVLink——为加速大型 AI 模型，NVLink 结合全新的外接 NVLink Switch，可将 NVLink 扩展为服务器间的互联网络。相比上一代 HDR Quantum InfiniBand，实现 9 倍的速度提升，并可连接多达 256 个 GPU。

六、DPX 指令——新的 DPX 指令可加速动态规划，适用于包括路径优化和基因组学在内的一系列算法，与 CPU 和上一代 GPU 相比，其速度提升分别可达 40 倍和 7 倍。

AI 开发只有顶尖的芯片是不够的，还需要软硬全栈和广阔的生态。NVIDIA 提供端到端的 AI 软件套件，覆盖数据准备、训练、推理优化到大规模部署等多个环节，以强大的资源调度和管理能力助力客户加速 AI 开发与部署。

NVIDIA 在加速计算领域的沉淀，以及其全新一代产品，为赋能飞桨生态奠定了基础。

NVIDIA 携手百度飞桨

加速 535 万开发者的 AI 进程

百度飞桨是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。近年来，飞桨的技术实力深受广大硬件厂商认可，合作日趋紧密，软硬一体协同发展，生态共创硕果累累。

NVIDIA 非常重视中国市场，特别关注中国的生态伙伴，而当前飞桨拥有 535 万的开发者。过去的几年中，NVIDIA 与飞桨一直保持着深度全面的合作关系。双方一起做了大量的开发与优化工作。

今年我们将飞桨列为 NVIDIA 全球前三的深度学习框架合作伙伴，在中国设立了专门的工程团队支持，赋能飞桨。关于 NVIDIA 与飞桨的合作，由于篇幅原因，我们仅从硬件适配的角度，沿用上图的四个阶段做一个简要的介绍。在数据处理方面，帮助飞桨集成 DALI；大规模训练，支持各类数据格式，ASP、CUDA 等算子函数 API；优化推理方面，开发了 Paddle-TRT，Deep Learning Examples；在规模部署方面，集成了 NCCL，开发了 Triton PaddlePaddle Backend。

刚才这些适配仅仅是让飞桨的开发者拥有高性能的推理训练成为可能，但是这些离行业开发者还很远，门槛还很高，难度还很大。为此，NVIDIA 将刚刚这些集成和优化的工作整合到三大产品线中：

NVIDIA NGC PaddlePaddle Container——NGC 飞桨容器，致力为开发者提供了一个最佳的飞桨开发环境，包含最新的 NVIDIA 工具包版本（CUDA, DALI 等）。
NVIDIA Deep Learning Examples——飞桨深度学习模型示例，让开发者能够快速使用一系列拥有极致性能的经典模型，例如 ResNet 50、BERT 等。
NVIDIA DLI （Deep Learning Institute）——飞桨共建课程。为了能更好地提高推训性能并简化代码，NVIDIA 深度学习培训中心（DLI）也准备了系列免费课程，以及由 NVIDIA 与飞桨联名的 DLI 课程证书，赋能开发者并给于权威认可。

在这三大举措中，NGC 飞桨容器最为引人注目。

飞桨和 NVIDIA 团队从与开发者用户的持续交流中，收集到了一些使用上的痛点需求。比如，在提供 NGC 飞桨容器前，飞桨用户如果希望使用 NVIDIA 最新软件栈进行开发、训练、部署，需要做大量的手动配置工作，这对不少用户而言是一个巨大的工程挑战。

针对这些需求，NVIDIA 与百度飞桨联合开发了 NGC 飞桨容器，将最新的飞桨与最新的 NVIDIA 的软件栈进行了无缝的集成与性能优化，最大程度地释放飞桨框架在 NVIDIA 最新硬件上的计算能力。这样，用户不仅可以快速开启 AI 应用，专注于创新和应用本身，还能够在 AI 训练和推理任务上获得飞桨 + NVIDIA 带来的飞速体验。

NGC 飞桨容器具有以下优点：

以月为单位升级更新，每月底发布全新版本，无需注册即可下载，支持多 GPU 和多节点系统。
适配最新版本的 NVIDIA 软件栈（例如最新版本 CUDA），更多功能，更高性能。
安全可靠。扫描漏洞和加密，适合在工作站、服务器、云上运行并经过测试。满足 NVIDIA NGC 开发及验证规范，质量管理。
专为企业和高性能计算设计，支持 Docker。
适配各种硬件环境：裸机、虚拟机、K8S、X86、ARM、Power、云、本地、边缘等。
应用广泛。适合各种工作内容、工作场景、各行业的应用。
性能优化。我们将其进行优化，并且具有很好的可扩展性。

为了让飞桨开发者用上基于 NVIDIA 最新的高性能硬件和软件栈，我们借用 NVIDIA NGC 完善的开发体系、质量管理、测试流程、文档规范、安全扫描等，开发了基于 NVIDIA GPU 平台最好的飞桨开发环境。

NGC 飞桨容器现已上线飞桨官网，开发者可以通过飞桨官网快速获取（如下图）。

下面，我们介绍一下 NVIDIA Deep Learning Examples，这是 NVIDIA 优化的工业级模型库，目标是让基于 NVIDIA GPU 的开发者复现极致精度和高性能的模型。NVIDIA Deep Learning Examples 中包括针对不同行业的模型，包括机器人、数字孪生、金融等等。

今年我们发布了 NVIDIA Deep Learning Examples PaddlePaddle ResNet50，只需要在 GitHub 中打开 NVIDIA Deep Learning Examples Repo，找到主页中的 PaddlePaddle Classification ResNet50 文件就可以得到它，里面有非常丰富的文档和信息。NVIDIA 基于各类网卡、A10、A30，基于各类拓扑结构，单机单卡、单机多卡等，都做了大量测试，并分享了详细的 Benchmark 供开发者参考（如下图）。

在本届 WAVE SUMMIT+ 开始前，NVIDIA 更与百度飞桨联合主办了“2022 飞桨 × NVIDIA AI 技术开放日”。作为 WAVE SUMMIT+ 的 “前哨站” ，本次活动邀请双方公司的 AI 技术专家与超过 2000 名开发者共同开展深度技术交流，内容囊括 NGC 飞桨容器特点、应用场景、模型优化，以及部署实践案例。

欲了解更多 NGC 飞桨容器，可查看以下延展介绍，或关注微信公众号【NVIDIA 英伟达企业解决方案】。

详细产品介绍视频

【飞桨开发者说｜NGC 飞桨容器全新上线 NVIDIA 产品专家全面解读】

https://www.bilibili.com/video/BV16B4y1V7ue?share_source=copy_web&vd_source=266ac44430b3656de0c2f4e58b4daf82

详细安装介绍

【NGC 飞桨容器安装指南】

https://www.paddlepaddle.org.cn/documentation/docs/zh/install/install_NGC_PaddlePaddle_ch.html

原文标题：WAVE SUMMIT+2022 大会回顾，NVIDIA 极致性能赋能飞桨落地千行百业

文章出处：【微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英伟达

英伟达

+关注

关注
22

文章
3727

浏览量
90731

原文标题：WAVE SUMMIT+2022 大会回顾，NVIDIA 极致性能赋能飞桨落地千行百业

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

倒计时1天 | 第三届OpenHarmony技术大会——明天，上海见！

技术引领筑生态，万物智联创未来 OpenHarmony 开源生态繁荣于各方共建，又赋能于千行百业开创了万物智联的新纪元，开源盛事，亦是开源盛世!

发表于 10-11 23:29

第三届OpenHarmony技术大会开启上海见

技术引领筑生态，万物智联创未来 OpenHarmony 开源生态繁荣于各方共建，又赋能于千行百业开创了万物智联的新纪元，开源盛事，亦是开源盛世!

发表于 10-11 10:08 •116次阅读

第三届OpenHarmony技术<b class='flag-5'>大会</b>开启上海见

科大讯飞引领大模型应用新浪潮

大模型的发展浪潮，离不开开发者的推波助澜。是一行行代码，构筑起大模型的坚实基座，加速人工智能走进千行百业，成为每个人的AI助手。

发表于 09-14 14:37 •1339次阅读

赋能创芯，共筑生态：航顺芯片HK32MCU新品发布，强势打破行业内卷

“赋能创芯，共筑生态”，不仅是对过去十多年航顺芯片技与代理商伙伴们共同奋斗的总结，更是未来也将为之奋斗的目标——用创新和核心技术打造高性能高性价比的HK32MCU，赋

发表于 08-07 10:30 •419次阅读

<b class='flag-5'>赋</b><b class='flag-5'>能</b>创芯，共筑生态：航顺芯片HK32MCU新品发布，强势打破行业内卷

AI时代创新潮涌，从探路到引路，萤石云引领千行百业创新

步入AI新时代，AI、云计算、大数据等技术迅速迭代，并日益融入经济社会发展各领域全过程，数字经济成为推动千行百业转型升级的重要驱动力量。今年的政府工作报告提出，深入推进数字经济创新发展。积极推进数字

发表于 07-01 15:17 •369次阅读

AI时代创新潮涌，从探路到引路，萤石云引领<b class='flag-5'>千行</b><b class='flag-5'>百业</b>创新

百度发布文心大模型4.0 Turbo与飞桨框架3.0,引领AI技术新篇章

SUMMIT深度学习开发者大会2024上，向世界展示了百度在AI领域的最新成果——文心大模型4.0 Turbo和飞桨框架3.0，并详细披露

发表于 06-29 16:03 •584次阅读

龙芯3A6000电脑赋能千行百业数字化转型

近日，近千台龙芯3A6000电脑走进福州某区各科室并服务于具体工作开展。该批电脑为龙芯发挥赋能本地产业生态作用，实现首批规模化应用的3A6000整机产品，由福建省电核心下属公司升腾资讯生产制造，搭载

发表于 06-18 17:01 •738次阅读

5G+北斗高精度定位终端技术，赋能千行百业应用

5G+北斗高精度定位终端技术的融合，正以前所未有的精准度和实时性，为千行百业带来革命性的变革。从智慧城市的精细化管理，到智能交通的实时调度，再到精准农业的播种与收割，这一技术正不断拓宽其应用领域，为

发表于 06-18 14:42 •424次阅读

5G+北斗高精度定位终端技术，<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>千行</b><b class='flag-5'>百业</b>应用

算能亮相第七届数字中国建设峰会，以算力赋能千行百业

题，全面展示了其在核心算力产品、产业数智化落地应用以及智算生态共建等领域的最新成果，以算力赋能千行百业。算力创新：筑基数字未来本届峰会期间，

发表于 05-29 08:33 •495次阅读

算<b class='flag-5'>能</b>亮相第七届数字中国建设峰会，以算力<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>千行</b><b class='flag-5'>百业</b>

报名开启！第二届OpenHarmony开发者大会2024重磅来袭！

，期待携手共筑万物互联的数字底座，创造千行百业在数智化时代的美好未来!特致此函，敬请拨冗莅临!恭候您的出席! 报名线下：https://bbs.elecfans.com

发表于 05-14 15:23

华为云以系统性创新加速千行万业智能化升级

近日，“华为云：一切皆服务，加速千行万业智能升级”主题论坛在第21届华为全球分析师大会期间举办。

发表于 04-20 09:53 •790次阅读

携手打造开放AI生态，英特尔助力千行百业数智化变革

还分享了在互联网、教育、制造及医疗等垂直领域的诸多应用落地，深度展示其携手生态伙伴推动千行百业数智化变革的进程。构建高效解决方案，释放企业AI潜力 2023年被业界视为生成式AI的元年，随着大模型和生成式AI的高速发展，企业正

发表于 04-19 16:23 •448次阅读

携手打造开放AI生态，英特尔助力<b class='flag-5'>千行</b><b class='flag-5'>百业</b>数智化变革

2023 NVIDIA 初创企业展示完美收官!

当电影创作透过简单的文字，即可将构想的场景轻松呈现；当人机交互打破虚拟与现实的边界，机器人也能“执刀”复杂的手术；当数字化赋能千行百

发表于 12-05 18:45 •487次阅读

OpenHarmony亮相MTSC 2023 | 质量&效率共进，赋能应用生态发展

。 OpenHarmony 展区：携手点亮千行百业的繁荣未来 OpenHarmony 展区展示了 OpenHarmony 生态进展及丰硕成果。现场不仅设有 OpenHarmony 兼容性测试工具和测试能力的体验展示

发表于 11-28 15:41

上海站报名启动！ 2023年开源产业生态大会OpenHarmony生态分论坛

终端操作系统根社区和万物互联的底座。 OpenHarmony生态分论坛旨在倡议更多生态伙伴加入OpenHarmony社区，携手伙伴赋能产业升级，助力万物互联的大业和千行百业的数字化转型

发表于 11-24 14:55

搜索历史

WAVE SUMMIT+2022 大会回顾，NVIDIA 极致性能赋能飞桨落地千行百业

评论