NVIDIA Jetson Orin深度学习加速器入门-电子发烧友网

如果你是一个活跃的 Jetson 开发者，你知道 NVIDIA ISAAC 的一个关键优点是它将 CPU 和 GPU 组合成一个单一的模块，在一个可以部署在边缘的小、低功耗软件包中为你提供扩展的 NVIDIA 软件堆栈。

Jetson 还具有多种其他处理器，包括硬件加速编码器和解码器、图像信号处理器和深度学习加速器（ DLA ）。

DLA 可在 Jetson AGX Xavier， Xavier NX， Jetson AGX Orin 和 Jetson Orin-NX 模块上使用。最近的 NVIDIA DRIVE Xavier 和基于 Orin 的平台也有 DLA 核心。

深度学习加速器概述

DLA 是一种特定于应用的集成电路，能够有效地执行固定操作，如卷积和池，这在现代神经网络架构中很常见。虽然 DLA 没有那么多支持的层作为 GPU ，它仍然支持许多流行的神经网络架构中使用的各种层。

在许多情况下，层支持可能涵盖模型的需求。例如， NVIDIA TAO 工具包包括 DLA 支持的各种预训练模型，从目标检测到动作识别。

虽然需要注意的是， DLA 吞吐量通常低于 GPU 的吞吐量，但它具有能效，允许您卸载深度学习工作负载，将 GPU 释放出来用于其他任务。或者，根据您的应用程序，您可以在 GPU 和 DLA 上同时运行相同的模型，以实现更高的净吞吐量。

许多 NVIDIA Jetson 开发者已经在使用 DLA 成功优化他们的应用程序。 Postmates 利用 DLA 和 GPU 优化了 Jetson AGX Xavier 上的交付机器人应用。这个菜鸟实验室使用 DLA 优化其物流车辆。如果您希望充分优化应用程序， DLA 是 Jetson 系列中需要考虑的一个重要部分。

如何使用深度学习加速器

图 1.Jetson Orin 上深度学习加速器的粗略架构图

要使用 DLA ，首先需要使用深度学习框架（如 PyTorch 或 TensorFlow ）来训练模型。接下来，您需要使用 NVIDIA TensorRT 导入并优化您的模型。 TensorRT 负责生成 DLA 引擎，也可以用作执行这些引擎的运行时。最后，您应该分析您的模式，并尽可能进行优化，以最大限度地提高 DLA 兼容性。

开始使用深度学习加速器

准备好潜水了吗？这个 Jetson_dla_tutorial GitHub 项目演示了一个基本的 DLA 工作流，可以帮助您优化 Jetson 的应用程序。

通过本教程，您可以学习如何在 PyTorch 中定义模型，使用 TensorRT 导入模型，使用 NVIDIA Nsight System profiler 分析性能，修改模型以获得更好的 DLA 兼容性，以及为 INT8 执行进行校准。请注意， CIFAR10 数据集用作玩具示例，以便于再现步骤。

关于作者

John Welsh 是 NVIDIA 自治机器的开发技术工程师，他与 NVIDIA Jetson 一起开发加速应用程序。

审核编辑：郭婷

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

解码器

解码器

+关注

关注
9

文章
1153

浏览量
40998
编码器

编码器

+关注

关注
45

文章
3680

浏览量
135429
深度学习

深度学习

+关注

关注
73

文章
5521

浏览量
121679

英伟达推出Jetson Orin Nano模组最高40TOPS性能，为机器人和边缘AI提供强动力

。具体参数方面，Jetson Orin具有NVIDIA Ampere架构GPU、基于Arm Cortex-A78架构的CPU、高达8GB的内存、新一代深度

发表于 09-21 09:44 •7968次阅读

NVIDIA Jetson的相关资料分享

。Jetson是以机器学习应用为目的而设计的，具有GPU的并行处理用的嵌入式计算板，用于高速执行图像识别、机器学习和自动驾驶等。爆炸式增长的AI模型的复杂性近年来，由于传感器技术的革新

发表于 11-09 08:26

NVIDIA Jetson介绍

首发极术社区如对Arm相关技术感兴趣，欢迎私信 aijishu20加入技术微信群。分享内容NVIDIA Jetson是嵌入式计算平台，具有低功耗、高性能和小体积等特点，可加速各行业的AI应用落地

发表于 12-14 08:05

NVIDIA Jetson AGX Orin提升边缘AI标杆

最新发布的 NVIDIA Jetson AGX Orin 提升边缘 AI 标杆，使我们在最新一轮行业推理基准测试中的领先优势更加明显。

发表于 04-09 08:24 •1459次阅读

NVIDIA推出全新Jetson Orin Nano系统级模组

NVIDIA 推出全新Jetson Orin Nano 系统级模组，扩充了NVIDIA Jetson产品阵容。全新

发表于 09-22 09:54 •1331次阅读

NVIDIA Nova Orin平台助力AMR的构建和部署

基于两个 Orin 模组。Jetson AGX Orin 通过 GPU 加速框架运行 NVIDIA Isaac 机器人堆栈和机器人操作系统

发表于 09-26 09:45 •1347次阅读

将Jetson AGX Orin开发者套件转化为任何Jetson Orin模块

随着 Jetson Orin Nano 在本次 GTC 大会的发布，整个 Jetson Orin 模块阵容现已揭晓。凭借高达 40 TOPS 的 AI 性能，

发表于 09-30 11:03 •2168次阅读

使用NVIDIA Jetson Orin Nano解决入门级边缘人工智能挑战

2022 年 GTC ， NVIDIA 宣布 Jetson Orin Nano 系列系统模块（ SoM ）。它们的 AI 性能是 NVIDIA Je

发表于 10-11 14:47 •2659次阅读

NVIDIA Jetson Orin Nano的性能基准

在本次 GTC 大会上，NVIDIA 发布了Jetson Orin Nano系列的系统级模组（SoM）。其 AI 性能是 NVIDIA Jetson

发表于 10-12 09:55 •3093次阅读

基于AdderNet的深度学习推理加速器

电子发烧友网站提供《基于AdderNet的深度学习推理加速器.zip》资料免费下载

发表于 10-31 11:12 •0次下载

GTC23 | 使用 NVIDIA Jetson Orin Nano 开发套件开发 AI 机器人及智能视觉系统

NVIDIA Jetson Orin Nano Developer Kit 为创建入门级 AI 机器人、智能无人机和智能视觉系统设定了一个新标准，同时简化了

发表于 03-29 03:40 •1682次阅读

NVIDIA 推出 Jetson AGX Orin 工业级模块助力边缘 AI

Jetson 边缘 AI 和机器人平台，您可以在此类复杂的环境中部署 AI 和传感器融合算法。 NVIDIA 在 COMPUTEX 2023 上发布了全新 Jetson AGX

发表于 06-05 10:45 •1325次阅读

利用 NVIDIA Jetson 将 AI 学习延展至边缘

.com/zh-cn/jetson/edu/ ）。自从 10 年前首次发布以来， NVIDIA Jetson 平台已经为全球嵌入式计算和边缘 AI 设立了标准。这些用于深度

发表于 06-13 20:55 •712次阅读

使用 DLA 在 NVIDIA Jetson Orin 上最大限度地提高深度学习性能

：深度学习加速器（DLA）中用于深度学习工作负载的专用深度

发表于 08-22 19:20 •1345次阅读

Orin芯片在汽车行业的应用

。 Orin芯片概述 Orin芯片是NVIDIA推出的一款系统级芯片（SoC），专为自动驾驶汽车设计。它基于ARM架构，集成了NVIDIA的GPU、

发表于 10-27 15:55 •1073次阅读