0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Jetson Orin深度学习加速器入门

星星科技指导员 来源:NVIDIA 作者:John Welsh 2022-10-10 15:46 次阅读

如果你是一个活跃的 Jetson 开发者,你知道 NVIDIA ISAAC 的一个关键优点是它将 CPUGPU 组合成一个单一的模块,在一个可以部署在边缘的小、低功耗软件包中为你提供扩展的 NVIDIA 软件堆栈。

Jetson 还具有多种其他处理器,包括硬件加速编码器和解码器、图像信号处理器和深度学习加速器( DLA )。

DLA 可在 Jetson AGX Xavier, Xavier NX, Jetson AGX Orin 和 Jetson Orin-NX 模块上使用。最近的 NVIDIA DRIVE Xavier 和基于 Orin 的平台也有 DLA 核心。

深度学习加速器概述

DLA 是一种特定于应用的集成电路,能够有效地执行固定操作,如卷积和池,这在现代神经网络架构中很常见。虽然 DLA 没有那么多 支持的层 作为 GPU ,它仍然支持许多流行的神经网络架构中使用的各种层。

在许多情况下,层支持可能涵盖模型的需求。例如, NVIDIA TAO 工具包 包括 DLA 支持的各种预训练模型,从目标检测到动作识别。

虽然需要注意的是, DLA 吞吐量通常低于 GPU 的吞吐量,但它具有能效,允许您卸载深度学习工作负载,将 GPU 释放出来用于其他任务。或者,根据您的应用程序,您可以在 GPU 和 DLA 上同时运行相同的模型,以实现更高的净吞吐量。

许多 NVIDIA Jetson 开发者已经在使用 DLA 成功优化他们的应用程序。 Postmates 利用 DLA 和 GPU 优化了 Jetson AGX Xavier 上的交付机器人应用。这个 菜鸟实验室 使用 DLA 优化其物流车辆。如果您希望充分优化应用程序, DLA 是 Jetson 系列中需要考虑的一个重要部分。

如何使用深度学习加速器

poYBAGNDzceAYkrUAAB96VlOq1o207.png

图 1.Jetson Orin 上深度学习加速器的粗略架构图

要使用 DLA ,首先需要使用深度学习框架(如 PyTorch 或 TensorFlow )来训练模型。接下来,您需要使用 NVIDIA TensorRT 导入并优化您的模型。 TensorRT 负责生成 DLA 引擎,也可以用作执行这些引擎的运行时。最后,您应该分析您的模式,并尽可能进行优化,以最大限度地提高 DLA 兼容性。

开始使用深度学习加速器

准备好潜水了吗?这个 Jetson_dla_tutorial GitHub 项目演示了一个基本的 DLA 工作流,可以帮助您优化 Jetson 的应用程序。

通过本教程,您可以学习如何在 PyTorch 中定义模型,使用 TensorRT 导入模型,使用 NVIDIA Nsight System profiler 分析性能,修改模型以获得更好的 DLA 兼容性,以及为 INT8 执行进行校准。请注意, CIFAR10 数据集用作玩具示例,以便于再现步骤。

关于作者

John Welsh 是 NVIDIA 自治机器的开发技术工程师,他与 NVIDIA Jetson 一起开发加速应用程序。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1132

    浏览量

    40687
  • 编码器
    +关注

    关注

    45

    文章

    3602

    浏览量

    134206
  • 深度学习
    +关注

    关注

    73

    文章

    5493

    浏览量

    121003
收藏 人收藏

    评论

    相关推荐

    英伟达推出Jetson Orin Nano模组最高40TOPS性能,为机器人和边缘AI提供强动力

    。具体参数方面,Jetson Orin具有NVIDIA Ampere架构GPU、基于Arm Cortex-A78架构的CPU、高达8GB的内存、新一代深度
    的头像 发表于 09-21 09:44 7608次阅读

    NVIDIA Jetson的相关资料分享

    Jetson是以机器学习应用为目的而设计的,具有GPU的并行处理用的嵌入式计算板,用于高速执行图像识别、机器学习和自动驾驶等。爆炸式增长的AI模型的复杂性近年来,由于传感技术的革新
    发表于 11-09 08:26

    NVIDIA Jetson介绍

    首发极术社区如对Arm相关技术感兴趣,欢迎私信 aijishu20加入技术微信群。分享内容NVIDIA Jetson是嵌入式计算平台,具有低功耗、高性能和小体积等特点,可加速各行业的AI应用落地
    发表于 12-14 08:05

    NVIDIA Jetson AGX Orin提升边缘AI标杆

    最新发布的 NVIDIA Jetson AGX Orin 提升边缘 AI 标杆,使我们在最新一轮行业推理基准测试中的领先优势更加明显。
    的头像 发表于 04-09 08:24 1394次阅读

    NVIDIA推出全新Jetson Orin Nano系统级模组

    NVIDIA 推出全新Jetson Orin Nano 系统级模组,扩充了NVIDIA Jetson产品阵容。全新
    的头像 发表于 09-22 09:54 1213次阅读

    NVIDIA Nova Orin平台助力AMR的构建和部署

    基于两个 Orin 模组。Jetson AGX Orin 通过 GPU 加速框架运行 NVIDIA Isaac 机器人堆栈和机器人操作系统
    的头像 发表于 09-26 09:45 1237次阅读

    Jetson AGX Orin开发者套件转化为任何Jetson Orin模块

    随着 Jetson Orin Nano 在本次 GTC 大会的发布,整个 Jetson Orin 模块阵容现已揭晓。凭借高达 40 TOPS 的 AI 性能,
    的头像 发表于 09-30 11:03 1990次阅读

    使用NVIDIA Jetson Orin Nano解决入门级边缘人工智能挑战

    2022 年 GTC , NVIDIA 宣布 Jetson Orin Nano 系列系统模块( SoM )。它们的 AI 性能是 NVIDIA Je
    的头像 发表于 10-11 14:47 2383次阅读
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> <b class='flag-5'>Orin</b> Nano解决<b class='flag-5'>入门</b>级边缘人工智能挑战

    NVIDIA Jetson Orin Nano的性能基准

    在本次 GTC 大会上,NVIDIA 发布了Jetson Orin Nano系列的系统级模组(SoM)。其 AI 性能是 NVIDIA Jetson
    的头像 发表于 10-12 09:55 2815次阅读

    基于AdderNet的深度学习推理加速器

    电子发烧友网站提供《基于AdderNet的深度学习推理加速器.zip》资料免费下载
    发表于 10-31 11:12 0次下载
    基于AdderNet的<b class='flag-5'>深度</b><b class='flag-5'>学习</b>推理<b class='flag-5'>加速器</b>

    GTC23 | 使用 NVIDIA Jetson Orin Nano 开发套件开发 AI 机器人及智能视觉系统

    NVIDIA Jetson Orin Nano Developer Kit  为创建入门级 AI 机器人、智能无人机和智能视觉系统设定了一个新标准,同时简化了 
    的头像 发表于 03-29 03:40 1485次阅读

    NVIDIA 推出 Jetson AGX Orin 工业级模块助力边缘 AI

    Jetson 边缘 AI 和机器人平台 ,您可以在此类复杂的环境中部署 AI 和传感融合算法。 NVIDIA 在 COMPUTEX 2023 上发布了全新 Jetson AGX
    的头像 发表于 06-05 10:45 1164次阅读
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Jetson</b> AGX <b class='flag-5'>Orin</b> 工业级模块助力边缘 AI

    利用 NVIDIA Jetson 将 AI 学习延展至边缘

    .com/zh-cn/jetson/edu/ )。自从 10 年前首次发布以来, NVIDIA Jetson 平台 已经为全球嵌入式计算和边缘 AI 设立了标准。这些用于深度
    的头像 发表于 06-13 20:55 624次阅读
    利用 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> 将 AI <b class='flag-5'>学习</b>延展至边缘

    使用 DLA 在 NVIDIA Jetson Orin 上最大限度地提高深度学习性能

    深度学习加速器(DLA)中用于深度学习工作负载的专用深度
    的头像 发表于 08-22 19:20 1124次阅读
    使用 DLA 在 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> <b class='flag-5'>Orin</b> 上最大限度地提高<b class='flag-5'>深度</b><b class='flag-5'>学习</b>性能

    Orin芯片在汽车行业的应用

    Orin芯片概述 Orin芯片是NVIDIA推出的一款系统级芯片(SoC),专为自动驾驶汽车设计。它基于ARM架构,集成了NVIDIA的GPU、
    的头像 发表于 10-27 15:55 631次阅读