NVIDIA Riva可快速开发出GPU加速对话式AI应用-电子发烧友网

AI 机器人和其他自主机器的开发和部署步伐不断加快。随着新一代应用的出现，需要大幅提升 AI 的计算性能才能处理实时并行运行的多模态 AI 应用。

在零售店、食品配送、医院、仓库、工厂车间和其他商业应用中，人类与机器人的互动日益增加。这些自主机器人必须同时执行 3D 感知、自然语言理解、路径规划、避障、位姿估测等行为。这些行为既需要超高的计算性能，还需要为每个应用训练高度准确的神经模型。

NVIDIA Jetson AGX Orin 模块是 NVIDIA Jetson 家族的最新成员并且在其中具有最强大的性能。该模块具有异常强大的性能和领先的能效，可以运行所有 NVIDIA AI 软件堆栈并驱动新一代高要求边缘 AI 应用。

Jetson AGX Orin 和 Jetson Orin NX 系列

在 2022 年春季 GTC 大会上，我们宣布在今年第四季度推出四款 Jetson Orin 模块。Jetson Orin 模块的最高性能达到每秒 275 万亿次运算（TOPS），可在边缘运行服务器级别的 AI 并且具有端到端应用流水线加速功能。与 Jetson Xavier 模块相比，Jetson Orin 为现代 AI 应用带来了更高的性能、能效和推理能力。

Jetson AGX Orin 系列包括 Jetson AGX Orin 64GB 和 Jetson AGX Orin 32GB 模块。

Jetson AGX Orin 64GB 最高算力为 275 TOPS，功率配置范围 15W 至 60W。

Jetson AGX Orin 32GB 最高算力为 200 TOPS，功率配置范围 15W 至 40W。

这些模块具有相同的紧凑外型，与 Jetson AGX Xavier 系列模块引脚兼容，性能提升了 8 倍或在相同的价格下提升了 6 倍。

边缘和嵌入式系统的传感器数量、性能和带宽继续增加。Jetson AGX Orin 系列不仅提供用于处理这些传感器的额外算力，而且还增加了 I/O：

多达22条PCIe Gen4通道

4个10Gb以太网

速度更快的CSI通道

采用64GB eMMC 5.1的双倍存储空间

1.5倍内存带宽

USB 3.2、UFS、MGBE 和 PCIe 共享 UPHY 通道。关于所支持的UPHY配置，请参见设计指南（https://developer.nvidia.com/embedded/downloads#？search=Jetson%20AGX%20Orin%20Product%20Design%20Guide）。

NVIDIA Orin NX 系列包括 Jetson Orin NX 16GB 和 Jetson Orin NX 8GB，前者的最大 AI 算力为 100 TOPS，后者的最大 AI 算力为 70 TOPS。该系列采用与 Jetson Xavier NX 类似的设计理念。我们将 NVIDIA Orin 架构封装到最小的 Jetson 外形尺寸中（即 260 针SODIMM）并且实现了更低的功耗。

您可以在无人机、手持设备等新一代小尺寸产品中实现这一更加强大的性能。Jetson Orin NX 16GB 的功率配置范围是 10W 至 25W，Jetson Orin NX 8GB 的功率配置范围是 10W 至 20W。

Orin NX 系列的外形与 Jetson Xavier NX 系列兼容，性能是后者的 5 倍或在相同价格下是后者的 3 倍。Orin NX 系列还提供额外的高速 I/O 能力，有多达 7 个 PCIe 通道和 3 个 10Gbps USB 3.2 接口。您可以使用额外的 PCIe 通道连接外部 NVMe 来扩展存储空间。

Jetson AGX Xavier 围绕 NVIDIA Xavier 系统级芯片设计，NVIDIA Xavier 是我们为自主机器重新开发的第一个架构。NVIDIA Orin 架构将此类产品提升到一个新的级别，我们在此基础上不断开发出能力、性能与能效更强大的系统级芯片。

Jetson Orin 模块包含以下内容：

NVIDIA Ampere 架构 GPU，具有多达 2048 个 CUDA 核和多达 64 个 Tensor 核

多达 12 个 Arm A78AE CPU 核

两个新一代深度学习加速器（DLA）

计算机视觉加速器

各种其他用于减轻GPU和CPU处理器的负担：

视频编码器

视频解码器

视频图像合成器

图像信号处理器

传感器处理引擎

音频处理引擎

与其他 Jetson 模块一样，Jetson Orin 采用了系统级模块（SOM）设计。所有处理、内存和电源轨都包含在模块上。所有高速 I/O 均通过一个 699 针的连接器（Jetson AGX Orin 系列）或一个 260 针的 SODIMM 连接器（Jetson Orin NX 系列）提供。这种 SOM 设计能够让您轻松地将模块集成到您的系统设计中。

Jetson AGX Orin 开发者套件

在 GTC 2022 上，NVIDIA 还宣布推出 Jetson AGX Orin 开发者套件。该开发套件包含了快速启动和运行所需的一切工具。它包括一个最高性能的 Jetson AGX Orin 模块并运行全球最先进的深度学习软件堆栈。该套件提供创建当前和未来复杂 AI 解决方案所需的灵活性。

凭借紧凑的尺寸、高速接口和大量连接器，该开发者套件非常适合用于制造、物流、零售、服务、农业、智慧城市、医疗、生命科学等领域的高级 AI 机器人和边缘应用原型设计。

Jetson AGX Orin开发者套件包含：

NVIDIA Ampere 架构 GPU 和 12 核 Arm Cortex-A78AE 64 位 CPU，以及新一代深度学习和视觉加速器

高速 I/O、204.8 GB/s 内存带宽和 32 GB DRAM，能够为多个并行 AI 应用流水线提供支持

强大的 NVIDIA AI 软件堆栈并支持 SDK 和软件平台，包括：

NVIDIA JetPack

NVIDIA Riva

NVIDIA DeepStream

NVIDIA Isaac

NVIDIA TAO

Jetson AGX Orin 开发者套件运行最新的 NVIDIA JetPack 5.0软件。NVIDIA JetPack 5.0 支持通过 Jetson AGX Orin 开发者套件模拟 Jetson Orin NX 和 Jetson AGX Orin 系列模块的性能和时钟频率。您今天就可以开始开发这些模块中的任何一个。

Jetson AGX Orin 开发者套件通过 NVIDIA 全球授权经销商销售。您可以根据入门指南开始使用该套件。

一流的性能

Jetson Orin 大幅提升新一代应用的性能。通过使用 Jetson AGX Orin 开发者套件，我们测得了我们高精度、生产级、预训练计算机视觉和对话式 AI 模型性能的几何平均值。测试包括以下基准：

用于人员检测的 NVIDIA PeopleNet

NVIDIA ActionRecognitionNet 2D 和 3D 模型

用于车牌识别的 NVIDIA LPRNet

用于多人位姿估测的 NVIDIA DashcamNet、BodyPoseNet

用于语音识别的 Citrinet-1024

用于自然语言处理的 BERT-base

用于文本-语音转换的 FastPitchHifiGanE2E

在 NVIDIA JetPack 5.0 开发者预览版中，Jetson AGX Orin 的性能比 Jetson AGX Xavier 提高了 3.3 倍。随着今后的软件改进，我们预计将实现接近 5 倍的性能提升。自首个支持该软件的版本—— NVIDIA JetPack 4.1.1 开发者预览版以来，Jetson AGX Xavier 的性能已提高了 1.5 倍。

这些基准测试已在我们的 Jetson AGX Orin 开发者套件上运行。PeopleNet 和 DashcamNet 提供在 GPU 和两个 DLA 上同时运行密集模型的示例。DLA 可以用于卸载 GPU 上的一些 AI 应用，并且这一并行能力使它们能够并行运行。

PeopleNet、LPRNet、DashcamNet 和 BodyPoseNet 提供在 Jetson 上运行密集 INT8 基准测试的示例。ActionRecognitionNet 2D 和 3D 以及对话式 AI 基准测试提供密集 FP16 性能的示例。

此外，Jetson Orin 继续提高边缘 AI 的标杆，在最新 MLPerf 行业推理基准测试中进一步巩固 NVIDIA 的整体领先优势。在此次 MLPerf 基准测试中，与 Jetson AGX Xavier 之前的结果相比，Jetson AGX Orin 的性能提高了 5 倍，能效平均提高了 2 倍。

通过Jetson软件加快产品上市时间

依靠强大的 NVIDIA 软件，Jetson Orin 实现了领先的性能和能效。这些软件被部署在 GPU 加速数据中心、超大规模服务器和高性能 AI 工作站中。

NVIDIA JetPack 是 Jetson 平台的基础 SDK。NVIDIA JetPack 为硬件加速边缘AI的开发提供了一个完整的开发环境。Jetson Orin 得到了 NVIDIA JetPack 5.0 的支持，后者包括：

LTS 内核 5.10

基于 Ubuntu 20.04 的根文件系统

基于 UEFI 的引导程序

带有 CUDA 11.4、TensorRT 8.4 和 cuDNN 8.3 的最新计算堆栈

NVIDIA JetPack 5.0 还支持 Jetson Xavier 模块。

为了让您在 Jetson 平台上能够快速开发全面加速的应用，NVIDIA 为各种不同的用例提供了应用框架：

使用 DeepStream 快速开发和部署视觉 AI 应用和服务。DeepStream 提供超越推理的硬件加速，它能为端到端 AI 流水线提供硬件加速插件。

NVIDIA Isaac 提供硬件加速 ROS 程序包，使 ROS 开发者更容易构建高性能机器人解决方案。

Omniverse 驱动的 NVIDIA Isaac Sim 能够创造高度逼真、达到物理级准确的虚拟环境，该工具可用于开发、测试和管理 AI 机器人。

NVIDIA Riva 为自动语音识别（ASR）和文本-语音转换（TTS）提供最先进、可以轻松自定义的预训练模型。这些模型使您能够快速开发出 GPU 加速对话式 AI 应用。

为了加快生产级、高精度 AI 模型的开发，NVIDIA 提供多种工具用于生成训练数据、训练和优化模型以及快速创建可立即部署的 AI 模型。

用于生成合成数据的 NVIDIA Omniverse Replicator 能够创建促进模型训练的高质量数据集。您可以使用 Omniverse Replicator 创建大型、多样化的合成数据集，这些数据集在现实世界中不仅难以创建，有时甚至不可能创建。使用合成数据和真实数据来训练模型可以显著提高模型的准确率。

NGC 上的 NVIDIA 预训练模型为您提供用于各种用例的高精度优化模型和模型架构。这些预训练模型为生产级模型。通过 NVIDIA TAO（训练-调整-优化）工作流程，您可以使用自己的真实或合成数据训练并进一步自定义这些模型，最终快速构建一个准确、可立即部署的模型。

审核编辑：彭菁

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据

数据

+关注

关注
8

文章
7091

浏览量
89254
NVIDIA

NVIDIA

+关注

关注
14

文章
5039

浏览量
103312
gpu

gpu

+关注

关注
28

文章
4754

浏览量
129102
AI

AI

+关注

关注
87

文章
31195

浏览量
269563

NVIDIA发布Cosmos平台，加速物理AI开发

)和机器人等物理AI系统的快速发展。 Cosmos平台的核心在于其强大的生成式世界基础模型，能够模拟和预测复杂环境中的各种物理现象。结合高级tokenizer，Cosmos能够高效地处理和分析大量数据，为物理

发表于 01-13 11:06 •182次阅读

NVIDIA Omniverse扩展至生成式物理AI领域

重要方向。这一创新举措不仅增强了Omniverse的多元化应用能力，更为全球软件开发和专业服务领域的领先企业提供了全新的开发工具和平台。借助Omniverse，这些企业能够更快地开发出基于物理

发表于 01-13 10:56 •149次阅读

NVIDIA和GeForce RTX GPU专为AI时代打造

NVIDIA 和 GeForce RTX GPU 专为 AI 时代打造。

发表于 01-06 10:45 •150次阅读

借助NVIDIA GPU提升鲁班系统CAE软件计算效率

本案例中鲁班系统高性能 CAE 软件利用 NVIDIA 高性能 GPU，实现复杂产品的快速仿真，加速产品开发和设计迭代，缩短

发表于 12-27 16:24 •172次阅读

《CST Studio Suite 2024 GPU加速计算指南》

许可证模型的加速令牌或SIMULIA统一许可证模型的SimUnit令牌或积分授权。 4. GPU计算的启用 - 交互式模拟：通过加速对话框

发表于 12-16 14:25

日本企业借助NVIDIA产品加速AI创新

日本领先企业和大学正在使用 NVIDIA NeMo、NIM 微服务和 NVIDIA Isaac 加速 AI 创新。

发表于 11-19 14:34 •341次阅读

NVIDIA生成式AI进入ROS社区

NVIDIA 在 ROSCon 上发布更新，旨在加速 AI 驱动的机械臂和自主移动机器人的开发。

发表于 10-31 14:41 •297次阅读

HOMEE AI利用NVIDIA Omniverse开发出“AI即服务”空间规划解决方案

HOMEE AI 是 NVIDIA 初创加速计划成员。该公司开发了一种“AI 即服务”空间规划解决方案，旨在为价值 6500 亿美元的全球家

发表于 09-09 10:00 •481次阅读

HOMEE <b class='flag-5'>AI</b>利用<b class='flag-5'>NVIDIA</b> Omniverse<b class='flag-5'>开发出</b>“<b class='flag-5'>AI</b>即服务”空间规划解决方案

NVIDIA AI助力SAP生成式AI助手Joule加速发展

在美国佛罗里达州奥兰多举行的 SAP Sapphire 大会上，NVIDIA 与这家企业软件公司公布了搭载NVIDIA AI Enterprise软件的生成式

发表于 09-09 09:37 •466次阅读

NVIDIA在加速计算和生成式AI领域的创新

在最新发布的公司 2024 财年可持续发展报告开篇的一封信中，NVIDIA 创始人兼首席执行官黄仁勋介绍了 NVIDIA 在加速计算和生成式 AI

发表于 09-09 09:18 •596次阅读

HPE 携手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 变革

by HPE 包含了可持续的加速计算产品组合以及全生命周期服务，将简化 AI 创造价值的过程，加速生成式

发表于 06-21 14:39 •391次阅读

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 变革

作为极具开创性的一站式“交钥匙”私有云人工智能（private-cloud AI）解决方案，NVIDIA AI Computing by HPE 包含了

发表于 06-20 17:36 •745次阅读

NVIDIA和谷歌云宣布开展一项新的合作，加速AI开发

NVIDIA 和谷歌云宣布开展一项新的合作，以帮助全球初创企业加速创建生成式 AI 应用和服务。

发表于 04-11 14:03 •529次阅读

NVIDIA数字人技术加速部署生成式AI驱动的游戏角色

NVIDIA 在 GDC 2024 大会上宣布，Inworld AI 等领先的 AI 应用程序开发者，正在使用 NVIDIA 数字人技术

发表于 04-09 10:08 •695次阅读

SAP与NVIDIA携手加速生成式AI在企业应用中的普及

SAP SE 和 NVIDIA 宣布深化合作，致力于加速企业客户在 SAP 云解决方案和应用组合中利用数据和生成式 AI 的变革力量。

发表于 03-22 10:02 •631次阅读

搜索历史

NVIDIA Riva可快速开发出GPU加速对话式AI应用

评论

NVIDIA发布Cosmos平台，加速物理AI开发

NVIDIA Omniverse扩展至生成式物理AI领域

NVIDIA和GeForce RTX GPU专为AI时代打造

借助NVIDIA GPU提升鲁班系统CAE软件计算效率

《CST Studio Suite 2024 GPU加速计算指南》

日本企业借助NVIDIA产品加速AI创新

NVIDIA生成式AI进入ROS社区

HOMEE AI利用NVIDIA Omniverse开发出“AI即服务”空间规划解决方案

NVIDIA AI助力SAP生成式AI助手Joule加速发展

NVIDIA在加速计算和生成式AI领域的创新

HPE 携手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 变革

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 变革

NVIDIA和谷歌云宣布开展一项新的合作，加速AI开发

NVIDIA数字人技术加速部署生成式AI驱动的游戏角色

SAP与NVIDIA携手加速生成式AI在企业应用中的普及