0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用NVIDIA Jetson Orin为边缘AI应用程序提供动力

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-18 09:19 次阅读

人工智能驱动的机器人和其他自主机器的开发和部署速度继续快速增长。下一代应用程序需要大幅提高 AI 计算性能,以处理实时并发运行的多模态 AI 应用程序。

在零售空间、食品配送、医院、仓库、工厂车间和其他商业应用中,人机交互正在增加。这些自主机器人必须同时执行 3D 感知、自然语言理解、路径规划、避障、姿势估计以及更多需要显着计算性能和针对每个应用程序的高度准确训练的神经模型的动作。

NVIDIA Jetson AGX Orin 模块是 NVIDIA Jetson 系列中性能最高的最新成员。这些模块提供卓越的性能和一流的能效。它们运行全面的 NVIDIA AI 软件堆栈,为下一代要求严苛的边缘 AI 应用程序提供动力。

Jetson AGX Orin 和 Jetson Orin NX 系列

在GTC 2022 春季大会上,我们宣布将在 2022 年第四季度推出四个 Jetson Orin 模块。凭借高达 275 tera 每秒操作 (TOPS) 的性能,Jetson Orin 模块可以在边缘运行服务器级 AI 模型,并提供端到端的服务。 -end 应用程序管道加速。与 Jetson Xavier 模块相比,Jetson Orin 为现代 AI 应用程序带来了更高的性能、能效和推理能力。

pYYBAGJcvJaAH_jlAALZGk7wFL4789.jpg

图 2. Jetson Xavier 和 Jetson Orin 模块 AI TOPS 性能比较

Jetson AGX Orin 系列包括 Jetson AGX Orin 64GB 和 Jetson AGX Orin 32GB 模块。

Jetson AGX Orin 64GB 提供高达 275 TOPS 的功率,可配置在 15W 和 60W 之间。

Jetson AGX Orin 32GB 可提供多达 200 个 TOP,功率可配置在 15W 和 40W 之间。

这些模块具有相同的紧凑外形,并且与 Jetson AGX Xavier 系列模块的引脚兼容,为您提供 8 倍的性能升级,或以相同的价格提升高达 6 倍的性能。

边缘和嵌入式系统继续受到越来越多的传感器数量、性能和带宽的驱动。Jetson AGX Orin 系列不仅带来了用于处理这些传感器的额外计算,还带来了额外的 I/O:

多达 22 个 PCIe Gen4 通道

四个 10Gb 以太网

高速 CSI 车道

64GB eMMC 5.1 使存储空间翻倍

1.5X 内存带宽

有关详细信息,请参阅Jetson Orin产品页面和Jetson AGX Orin 系列数据表。

poYBAGJcvJiAQ5xrAAGa56MtLAs302.jpg

图 3. Jetson AGX Orin 系列模块

USB 3.2、UFS、MGBE 和 PCIe 共享 UPHY 通道。有关支持的 UPHY 配置,请参阅设计指南。

NVIDIA Orin NX 系列包括具有高达 100 TOPS 的 AI 性能的 Jetson Orin NX 16GB 和高达 70 TOPS 的 Jetson Orin NX 8GB。在这个系列中,我们遵循了与 Jetson Xavier NX 类似的设计理念。我们带来了 NVIDIA Orin 架构,并将其带到了最小的 Jetson 外形尺寸,260 针 SODIMM,功耗更低。

您可以将这种更高级别的性能带入您的下一代小型产品,如无人机和手持设备。Jetson Orin NX 16GB 的功率可配置在 10W 和 25W 之间,Jetson Orin NX 8GB 的功率可配置在 10W 和 20W 之间。

Orin NX 系列的外形尺寸与 Jetson Xavier NX 系列兼容,可提供高达 5 倍的性能,或以相同的价格提供高达 3 倍的性能。Orin NX 系列还带来了额外的高速 I/O 功能,多达 7 个 PCIe 通道和三个 10Gbps USB 3.2 接口。对于存储,您可以利用额外的 PCIe 通道连接到外部 NVMe。有关详细信息,请参阅Jetson Orin产品页面。

pYYBAGJcvJiAD-9pAAGbZCCvBFs038.jpg

图 4. Jetson Orin NX 系列模块

Jetson AGX Xavier 是围绕 NVIDIA Xavier SoC 设计的,这是我们为自主机器从头开始开发的第一个架构。NVIDIA Orin 架构将此类产品提升到一个新的水平。它继续展示多种不同的片上处理器,但带来了更强大的功能、更高的性能和更高的能效。

Jetson Orin 模块包含以下内容:

具有多达 2048 个 CUDA 内核和多达 64 个张量内核的 NVIDIA Ampere 架构 GPU

多达 12 个 Arm A78AE CPU 内核

两个下一代深度学习加速器 (DLA)

计算机视觉加速器

用于卸载 GPU 和 CPU 的各种其他处理器:

视频编码器

视频解码器

视频图像合成器

图像信号处理器

传感器处理引擎

音频处理引擎

与其他 Jetson 模块一样,Jetson Orin 是使用模块上系统 (SOM) 设计构建的。所有处理、内存和电源轨都包含在模块上。所有高速 I/O 均可通过 699 针连接器(Jetson AGX Orin 系列)或 260 针 SODIMM 连接器(Jetson Orin NX 系列)获得。这种 SOM 设计使您可以轻松地将模块集成到您的系统设计中。

Jetson AGX Orin 开发者套件

在GTC 2022上,NVIDIA 还宣布推出Jetson AGX Orin 开发者套件。开发人员工具包包含您快速启动和运行所需的一切。它包括具有最高性能的 Jetson AGX Orin 模块,并运行世界上最先进的深度学习软件堆栈。该套件提供了在现在和未来创建复杂 AI 解决方案的灵活性。

紧凑的尺寸、高速接口和大量连接器使这款开发工具包非常适合为制造、物流、零售、服务、农业、智慧城市、医疗保健、生命科学等领域的先进人工智能机器人和边缘应用进行原型设计。

poYBAGJcvJqAJXUFAAR4WestNh0987.png

图 5. Jetson AGX Orin 开发者套件

Jetson AGX Orin 开发者套件特点:

NVIDIA Ampere 架构 GPU 和 12 核 Arm Cortex-A78AE 64 位 CPU,以及下一代深度学习和视觉加速器

高速 I/O、204.8 GB/s 的内存带宽和 32 GB 的 DRAM,能够支持多个并发 AI 应用程序管道

强大的 NVIDIA AI 软件堆栈,支持 SDK 和软件平台,包括:

英伟达喷气背包

英伟达里瓦

英伟达 DeepStream

英伟达艾萨克

英伟达陶

Jetson AGX Orin 开发套件运行最新的 NVIDIA JetPack 5.0 软件。NVIDIA JetPack 5.0 支持使用 Jetson AGX Orin 开发工具包模拟 Jetson Orin NX 和 Jetson AGX Orin 系列模块的性能和时钟频率。您可以立即开始开发这些模块中的任何一个。

Jetson AGX Orin 开发人员套件可通过全球 NVIDIA 授权经销商购买。按照入门指南立即开始。

开发者工具包AGX 奥林 64GBAGX 奥林 32GB

人工智能性能275 个 INT8 稀疏 TOP200 个 INT8 稀疏 TOP

图形处理器

具有 64 个张量核心 的 2048 核 NVIDIA 安培架构 GPU具有 56 个张量核心的 1792 核 NVIDIA Ampere 架构 GPU

中央处理器12 核 Arm Cortex-A78AE v8.2

64 位 CPU 3MB L2 + 6MB L38 核 Arm Cortex-A78AE v8.2

64 位 CPU 2MB L2 + 4MB L3

力量15W-60W15W-40W

记忆32 GB64 GB32GB

建议零售价1,999 美元1,599 美元899 美元

表 2. Jetson AGX Orin 系列模块和 Developer Kit 的总结比较

一流的性能

Jetson Orin 为您的下一代应用程序提供了巨大的飞跃。使用 Jetson AGX Orin 开发人员套件,我们为我们的高度准确、生产就绪、预训练的计算机视觉和会话 AI 模型获取了测量性能的几何平均值。测试包括以下基准:

用于人员检测的NVIDIA PeopleNet

NVIDIA ActionRecognitionNet 2D 和 3D 模型

用于车牌识别的NVIDIA LPRNet

NVIDIA DashcamNet , BodyPoseNet用于多人人体姿态估计

Citrinet-1024用于语音识别

BERT-base用于自然语言处理

用于文本到语音的FastPitchHifiGanE2E

借助 NVIDIA JetPack 5.0 开发者预览版,Jetson AGX Orin 与 Jetson AGX Xavier 相比,性能提升了 3.3 倍。随着未来软件的改进,我们预计这将接近 5 倍的性能提升。自从 NVIDIA JetPack 4.1.1 开发者预览版(第一个支持它的软件版本)以来,Jetson AGX Xavier 的性能提高了 1.5 倍。

pYYBAGJcvJ-AO1KgAAC-AyA2dfQ249.png

图 6. 预训练模型性能基准图表

基准测试已在我们的 Jetson AGX Orin 开发工具包上运行。PeopleNet 和 DashcamNet 提供了可以在 GPU 和两个 DLA 上同时运行的密集模型的示例。DLA 可用于从 GPU 卸载一些 AI 应用程序,这种并发能力使它们能够并行运行。

PeopleNet、LPRNet、DashcamNet 和 BodyPoseNet 提供了在 Jetson 上运行的密集 INT8 基准测试的示例。ActionRecognitionNet 2D 和 3D 以及对话式 AI 基准提供了密集 FP16 性能的示例。所有这些模型都可以在NVIDIA NGC上找到。

此外,Jetson Orin 继续提高边缘 AI 的标准,在最新的 MLPerf 行业推理基准测试中进一步提升了 NVIDIA 的整体排名。与之前在 Jetson AGX Xavier 上的结果相比,Jetson AGX Orin 在这些 MLPerf 基准测试中的性能提升高达 5 倍,同时平均能效提高 2 倍。

poYBAGJcvJ-ABVWiAADn_Y0qflg927.png

图 7. Jetson AGX Orin 性能

使用 Jetson 软件加快上市时间

Jetson Orin 一流的性能和能效得到了同样强大的 NVIDIA AI 软件的支持,该软件部署在 GPU 加速的数据中心、超大规模服务器和强大的 AI 工作站中。

pYYBAGJcvKGAdCdZAACFtwJEkdU100.png

图 8. Jetson 软件概览

NVIDIA JetPack是 Jetson 平台的基础 SDK。NVIDIA JetPack 为硬件加速的边缘 AI 开发提供了完整的开发环境。Jetson Orin 受 NVIDIA JetPack 5.0 支持,其中包括:

LTS 内核 5.10

基于 Ubuntu 20.04 的根文件系统

基于 UEFI 的引导加载程序

具有 CUDA 11.4、TensorRT 8.4 和 cuDNN 8.3 的最新计算堆栈

NVIDIA JetPack 5.0 还支持 Jetson Xavier 模块。

为了您在 Jetson 平台上快速开发完全加速的应用程序,NVIDIA 提供了适用于各种用例的应用程序框架:

借助DeepStream,快速开发和部署视觉 AI 应用程序和服务。DeepStream 提供了超越推理的硬件加速,因为它提供了用于端到端 AI 管道加速的硬件加速插件。

NVIDIA Isaac提供硬件加速的 ROS 软件包,使 ROS 开发人员能够更轻松地构建高性能机器人解决方案。

由 Omniverse 提供支持的NVIDIA Isaac Sim是一种工具,它支持照片般逼真、物理上精确的虚拟环境,以开发、测试和管理基于 AI 的机器人。

NVIDIA Riva为自动语音识别 (ASR) 和文本转语音 (TTS) 提供最先进的预训练模型,这些模型可以轻松定制。这些模型使您能够快速开发 GPU 加速的对话式 AI 应用程序。

为了加快开发可用于生产且高度准确的 AI 模型的时间,NVIDIA 提供了各种工具来生成训练数据、训练和优化模型,并快速创建可部署的 AI 模型。

用于合成数据生成的NVIDIA Omniverse Replicator有助于创建高质量数据集以促进模型训练。使用 Omniverse Replicator,您可以创建大型且多样化的合成数据集,这不仅很难,而且有时在现实世界中是不可能创建的。使用合成数据和真实数据来训练模型,可以显着提高模型的准确性。

NGC 的NVIDIA 预训练模型为您提供适用于各种用例的高度准确和优化的模型和模型架构。预训练模型可用于生产。您可以通过使用您自己的真实或合成数据进行训练来进一步自定义这些模型,使用NVIDIA TAO(训练-适应-优化)工作流程快速构建准确且可立即部署的模型。

关于作者

Leela Karumbunathan 是 NVIDIA 的硬件产品经理,专注于 Jetson 和自主机器。她曾在半导体行业担任过工程和产品相关职位。她在约翰霍普金斯大学获得电气工程学士学位。

Suhas Sheshadri 是 NVIDIA 的产品经理,专注于 Jetson 软件。他之前曾在 NVIDIA 的自动驾驶团队工作,为 NVIDIA Drive 平台优化系统软件。在空闲时间,Suhas 喜欢阅读有关量子物理学和博弈论的书籍。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4841

    浏览量

    102689
  • AI
    AI
    +关注

    关注

    87

    文章

    29635

    浏览量

    267967
  • 应用程序
    +关注

    关注

    37

    文章

    3232

    浏览量

    57535
收藏 人收藏

    评论

    相关推荐

    Orin芯片与边缘计算结合

    Orin芯片,作为英伟达推出的一款高性能AI处理器,与边缘计算的结合,无疑将为智能计算领域带来革命性的变化。 一、Orin芯片的创新特点 Orin
    的头像 发表于 10-27 16:51 590次阅读

    Orin芯片功耗分析

    NVIDIA推出的一款专为自动驾驶设计的系统级芯片(SoC),它基于Arm架构,采用了先进的制程技术。Orin芯片集成了多个高性能的CPU核心、GPU核心以及深度学习加速器(DLA),能够提供高达200 TOPS(每秒万亿次操
    的头像 发表于 10-27 15:45 294次阅读

    Orin芯片与其他芯片对比

    。 1. 性能对比 Orin芯片: 核心数量: Orin芯片拥有高达2048个CUDA核心,这提供了强大的图形处理能力。 AI性能: 根
    的头像 发表于 10-27 15:42 420次阅读

    NVIDIA Jetson Orin系列边缘计算主机

    EC-OrinNano和EC-OrinNX均搭载NVIDIA原装JetsonOrin核心板模组,该系列可提供强大的AI计算能力、大容量统一内存和全面的软件堆栈,支持Transformer架构的大模型
    的头像 发表于 07-10 08:02 578次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> <b class='flag-5'>Orin</b>系列<b class='flag-5'>边缘</b>计算主机

    NVIDIA 通过 Holoscan NVIDIA IGX 提供企业软件支持

    美敦力、SETI 协会以及领先制造商正在构建 NVIDIA IGX 系统, AI 在工业边缘赋能。   NVIDIA 于6月2日宣布,集成
    的头像 发表于 06-04 10:21 443次阅读

    NVIDIA 通过 Holoscan NVIDIA IGX 提供企业软件支持,实现边缘实时医疗、工业和科学 AI 应用

    美敦力、SETI协会以及领先的制造商正在构建  NVIDIA IGX 系统,  AI 在工业边缘赋能     COMPUTEX — 2024 年 6 月 2 日 —
    发表于 06-03 09:48 271次阅读
      <b class='flag-5'>NVIDIA</b> 通过 Holoscan <b class='flag-5'>为</b> <b class='flag-5'>NVIDIA</b> IGX <b class='flag-5'>提供</b>企业软件支持,实现<b class='flag-5'>边缘</b>实时医疗、工业和科学 <b class='flag-5'>AI</b> 应用

    NVIDIA Jetson嵌入式计算领域探索AI可能

    自动化业务流程、通过数据分析获得洞察力、与客户和员工互动……如今 AI 正在大幅提高生产力,推动竞争优势。NVIDIA Jetson 是适用于自主机器和其他嵌入式应用的先进平台,具有出色的 A
    的头像 发表于 01-25 17:03 483次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b><b class='flag-5'>为</b>嵌入式计算领域探索<b class='flag-5'>AI</b>可能

    莱迪思半导体推出全新传感器桥接参考设计

    近日,莱迪思半导体公司宣布推出全新的传感器桥接参考设计,旨在加速NVIDIA Jetson Orin和IGX Orin平台的网络边缘
    的头像 发表于 01-04 15:31 757次阅读

    凌华科技发布全新工业级边缘AI平台

    DLAP-211-Orin系列和DLAP-411-Orin工业级边缘AI平台,重新定义了智慧城市、零售、安全、工厂和制造等各个领域的AI应用
    的头像 发表于 12-13 11:27 725次阅读

    NVIDIA Jetson 的嵌入式系统AI应用

    在这个平台上可以使用多个不同的芯片 ,案例的主角是AIMobile AIM Edge Ncox,一款基于NVIDIA Jetson Orin NX的小型被动冷却嵌入式系统。该系统具有6-8个Arm内核和
    发表于 12-11 17:37 509次阅读

    Neousys宸曜科技强固型Jetson AGX Orin边缘计算平台,赋能视觉边缘计算AI推理应用

    工业级强固型嵌入式平台厂商Neousys宸曜科技发布了新的NVIDIA Jetson无风扇嵌入式计算平台NRU-220S系列。NRU-220S系列搭载了Jetson AGX Orin
    的头像 发表于 12-05 11:12 531次阅读

    BOXER-8651AI:最小的NVIDIA Jetson Orin NX系统

    轻松通过壁挂方式部署,可提供最佳的连接性和实时运算性能,即使在狭小的空间中也能出色发挥。BOXER-8651AI的设计旨在实现各种不同行业的边缘AI需求,
    的头像 发表于 11-25 08:05 586次阅读
    BOXER-8651<b class='flag-5'>AI</b>:最小的<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> <b class='flag-5'>Orin</b> NX系统

    NVIDIA再出手!加速开发边缘AI应用,迎接生成式AI新纪元

    NVIDIA 近日宣布,对适用于边缘 AI 和机器人的 NVIDIA Jetson 平台上的两个框架进行大规模扩展。
    的头像 发表于 11-23 17:31 1007次阅读
    <b class='flag-5'>NVIDIA</b>再出手!加速开发<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>应用,迎接生成式<b class='flag-5'>AI</b>新纪元

    在线研讨会 | 在 Jetson 上使用 Metropolis API 和微服务加速边缘人工智能开发

    研讨会时间: 2023 年 11 月 17 日(周五)中午 12:00  (北京时间) 边缘构建视觉 AI 应用程序通常需要经历一个耗时且昂贵的开发周期。
    的头像 发表于 11-10 17:35 253次阅读
    在线研讨会 | 在 <b class='flag-5'>Jetson</b> 上使用 Metropolis API 和微服务加速<b class='flag-5'>边缘</b>人工智能开发

    利用 NVIDIA Jetson 实现生成式 AI

    近日,NVIDIA 发布了 Jetson 生成式 AI 实验室(Jetson Generative AI Lab),使开发者能够通过
    的头像 发表于 11-07 21:25 885次阅读
    利用 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> 实现生成式 <b class='flag-5'>AI</b>