0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Jetson Xavier NX世上最小嵌入式AI超级计算机

星星科技指导员 来源:NVIDIA 作者:Dustin Franklin 2022-04-18 14:58 次阅读

NVIDIA 发布了世界上最小、最先进的用于自主机器人和边缘计算设备的嵌入式 AI超级计算机 Jetson Xavier NX 。 Jetson Xavier NX 能够在紧凑的 70x45mm 外形中部署服务器级性能,在 15W 的功率下可提供多达 21 台计算机, MLPerf Inference 0.5 是基于 NVIDIA’s Xavier 引脚的 Jetson Nano 的最新计算结果,部署工作负载可能会受到限制,比如基于成本和性能的限制。

图 2 : Jetson Xavier NX 处理器引擎的框图,包括高速 I / O 和内存结构。

如图 2 所示, Jetson Xavier NX 包括集成的 384 核 NVIDIA Volta GPU , 48 个张量核, 6 核 NVIDIA Carmel ARMv8 。 2 64 位 CPU , 8GB 128 位 LPDDR4x ,双 NVIDIA 深度学习加速器( NVDLA )引擎, 4K 视频编码器和解码器,专用摄像机摄取,最多 6 个同时高分辨率传感器流, PCIe Gen 3 扩展、双显示端口/ HDMI 4K 显示器、 USB 3 。 1 和 GPIO ,包括 SPI 、 I2C 、 I2S 、 CAN 总线和 UART 。有关特性列表,请参阅下表 1 ,有关完整规格,请参阅 Jetson Xavier NX 模块数据表 。共享内存结构允许处理器自由地共享内存,而不会产生额外的内存拷贝(称为零拷贝),这有效地提高了系统的带宽利用率和吞吐量。

表 1 : Jetson Xavier NX 计算模块特性和功能

* CPU 4 / 6 核模式下的最大工作频率为 1400MHz ,双核模式下的最大工作频率为 1900MHz

†最大并发流数,达到总吞吐量。支持的视频编解码器: H 。 265 、 H 。 264 、 VP9

有关具体的编解码器和配置文件规范,请参阅 Jetson Xavier NX 模块数据表 。

†††每通道 2 英镑/ MIP ,总计 2 英镑。

‡ PCIe 1 × 1 仅支持根端口, 1 × 1 / 2 / 4 支持根端口或端点模式

^工作温度范围, Xavier SoC 结温( Tj )

Jetson Xavier NX 由 NVIDIA 完整的 CUDA -X 软件栈和 JetPack SDK 开发包 为 AI 开发提供支持,除了实时计算机视觉外,还可以在多个高分辨率传感器流上同时运行流行的机器学习框架和复杂的 DNN ,在全桌面 Linux 环境中加速图形和丰富的多媒体应用程序。 Jetson 与 NVIDIA 的 AI 加速计算平台的兼容性使得开发更加容易,云和 edge 之间的 MIG 无缝匹配。

设计抵押品 Jetson Xavier NX 设计指南 NX 模块将于 2020 年 3 月面市,售价 399 美元,嵌入式设计师可以参考可供下载的 Jetson ,包括 Xavier ,为 Jetson Xavier NX 模块创建生产设备和系统。与 Jetson Nano 的引脚兼容性允许共享设计和直接的技术插入升级到 Jetson Xavier NX 。除了提供现成的载体、传感器和配件外, Jetson 生态系统 的硬件设计合作伙伴还能够提供定制设计服务和系统集成。

软件开发人员现在可以开始为 Jetson Xavier NX 构建人工智能应用程序,方法是使用 Jetson AGX Xavier 开发工具包,并将 设备配置修补程序 应用到 JetPack 上,使设备的行为类似于 Jetson Xavier NX 。通过软件,它将改变可用的 CPU 和 GPU 核心的数量,此外还可以设置整个系统的核心时钟频率和电压。该补丁是完全可逆的,可用于在硬件可用之前近似于 Jetson Xavier NX 的性能。

Jetson Xavier NX 定义了 10 和 15W 的默认电源模式,根据活动模式,可实现 14 到 21 个峰值性能。用于管理电源配置文件的 nvpmodel 工具可调整 CPU 、 GPU 、内存控制器和其他 SoC 时钟的最大时钟频率,以及在线 CPU 集群的数量 – 这些设置如表 2 所示,适用于 Jetson Xavier NX 的预定义 10W 和 15W 模式。 CPU 分为三组,每组 2 个核, 4 / 6 核模式下的最大工作频率为 1400MHz ,双核模式下的最高工作频率为 1900MHz ,对于可能需要更高单线程性能和多线程性能的应用而言,最高工作频率为 1900MHz 。

NVIDIA Jetson Xavier NX – Power Modes

表 2 : Jetson Xavier NX 10W 和 15W 电源模式的最大工作频率和核心配置。

*使用 NVDLA 时, GPU 最大工作频率为 600MHz ( 10W 模式)和 1000MHz ( 15W 模式)

根据工作负载,动态电压和频率缩放( DVFS )调控器在运行时将频率调整到活动 nvpmodel 所定义的最大限制,因此在空闲时根据处理器利用率降低功耗。 nvpmodel 工具还可以根据应用需求和 TDP 轻松创建和定制新的电源模式。可以编辑电源配置文件并将其添加到/ etc / NVP 模式。 conf 配置文件和一个 GUI 小部件被添加到 Ubuntu 状态栏中,以便在运行时方便地管理和切换电源模式。

深度学习推断基准

今天 NVIDIA 还宣布,它在 MLPerf 推断 0 。 5 基准测试中占据了 5 个类别中的 4 个类别的榜首,其中 Jetson AGX Xavier 是边缘计算 SoC 的领导者,包括所有基于视觉的任务:使用 Mobilenet 和 ResNet-50 进行图像分类,以及使用 SSD Mobilenet 和 SSD ResNet 进行目标检测。 NVIDIA GPUs 是十个竞争芯片架构中唯一一个在 MLPerf 定义的所有五个推断测试中提交结果的。

为了参考 Jetson 家族成员之间的可伸缩性,我们还测量了 Jetson Nano 、 Jetson TX2 、 Jetson Xavier NX 和 Jetson AGX Xavier 对图像分类、目标检测、位姿估计、分割等常用 DNN 模型的推理性能。这些结果,如下面的图 3 所示,是用 JetPack 和 NVIDIA 的 TensorRT 推断加速器库运行的,该库优化了网络的实时性能,该库是在流行的 ML 框架(如 TensorFlow 、 PyTorch 、 Caffe 、 MXNet 等)中训练出来的。

图 3 。用 TensorRT 来推断 Jetson 家族中各种基于视觉的 DNN 模型的性能。

Jetson Xavier NX 的性能比 Jetson TX2 高 10 倍,功耗相同,占地面积小 25% 。在这些基准测试期间,每个平台都以最高性能运行( MAX-N 模式用于 Jetson AGX Xavier , Xavier NX 和 TX2 为 15W , Nano 为 10W )。最大吞吐量是在批处理大小不超过 16ms 的延迟阈值的情况下获得的,否则,对于平台超过该延迟阈值的网络,批处理大小为 1 。这种方法在实时应用程序的确定性低延迟需求和多流用例场景的最大性能之间提供了平衡。

在 Xavier Jetson NX 和 Jetson AGX Xavier 上, NVDLA 引擎和 GPU 同时以 INT8 精度运行,而在 Jetson Nano 和 Jetson TX2 上 GPU 以 FP16 精度运行, Jetson Xavier NX 中具有张量核心的 Volta 架构 GPU 可以达到 12 。 3 个计算顶层,而该模块的 DLA 引擎每台最多可产生 4 。 5 台。

除了用 TensorRT 运行神经网络外, ML 框架还可以通过 cuDNN 和 CUDA 加速在 Jetson 上安装,包括 TensorFlow 、 PyTorch 、 Caffe / Caffe2 、 MXNet 、 Keras 等。除了 AWS Greengrass 等物联网框架和 Docker 和 Kubernetes 等容器引擎外, Jetson 动物园 还包括这些预构建的安装程序和构建说明。

开发突破性的人工智能产品

Jetson Xavier NX 为部署下一代自主系统和智能边缘设备开辟了新的机遇,这些设备需要在较小、低功耗的空间内实现高性能人工智能和复杂的 DNN ,比如移动机器人无人机、智能相机、便携式医疗设备、嵌入式物联网系统等等。 NVIDIA 支持 CUDA -X 的 JetPack SDK 提供了开发尖端 AI 解决方案的完整工具,并以世界领先的性能在云端和边缘之间扩展应。

关于作者

Dustin Franklin 是 NVIDIA 的 Jetson 团队的开发人员布道者。 Dustin 拥有机器人和嵌入式系统方面的背景,他乐于在社区中提供帮助,并与 Jetson 一起参与项目。你可以在 NVIDIA Developer Forums 或 Github 上找到他。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5076

    文章

    19045

    浏览量

    303853
  • 机器人
    +关注

    关注

    210

    文章

    28266

    浏览量

    206721
  • NVIDIA
    +关注

    关注

    14

    文章

    4952

    浏览量

    102861
  • 嵌入式AI
    +关注

    关注

    0

    文章

    34

    浏览量

    815
收藏 人收藏

    评论

    相关推荐

    NVIDIA加速全球大多数超级计算机推动科技进步

    HPCwire 读者和编辑选择奖。 自 2006 年发布 CUDA 以来,NVIDIA 不断推动 AI 和加速计算的进步,最新发布的全球最强超级
    的头像 发表于 11-24 14:38 262次阅读
    <b class='flag-5'>NVIDIA</b>加速全球大多数<b class='flag-5'>超级</b><b class='flag-5'>计算机</b>推动科技进步

    NVIDIA助力xAI打造全球最大AI超级计算机

    NVIDIA 宣布,xAI 位于田纳西州孟菲斯市的Colossus 超级计算机集群达到了 10 万颗 NVIDIA Hopper GPU 的巨大规模。该集群使用了
    的头像 发表于 10-30 11:38 310次阅读

    NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

    市的 Colossus 超级计算机集群达到了 10 万颗 NVIDIA® Hopper  GPU 的巨大规模。该集群使用了 NVIDIA Spectrum-X™ 以太网网络平台,该平台
    发表于 10-30 09:33 125次阅读
    <b class='flag-5'>NVIDIA</b> 以太网加速 xAI 构建的全球最大 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    NVIDIA助力丹麦发布首台AI超级计算机

    这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设,是一台 NVIDIA DGX SuperPOD 超级
    的头像 发表于 10-27 09:42 401次阅读

    ARMxy ARM嵌入式计算机搭载 1 TOPS NPU支持深度学习

    ARMxy ARM嵌入式计算机BL410系列内置了1TOPS算力 NPU,它每秒可以执行高达一万亿次的浮点运算,这为复杂的图像处理和深度学习任务提供了充足的计算资源。在产品缺陷检测领域,ARMxy ARM嵌入式计算机具备的这一算
    的头像 发表于 08-20 11:53 310次阅读
    ARMxy ARM<b class='flag-5'>嵌入式计算机</b>搭载 1 TOPS NPU支持深度学习

    借助NVIDIA超级计算机加速量子计算发展

    科学期刊《自然》(Nature)本月早些时候发表了一项研究,通过使用 NVIDIA 驱动的超级计算机,验证了量子计算的商业化途径。
    的头像 发表于 07-25 09:55 498次阅读

    计算机行业携手 NVIDIA 为新工业革命打造 AI 工厂和数据中心

    领先的计算机制造商推出一系列 Blackwell 赋能的系统,搭载 Grace CPU、NVIDIA 网络和基础设施 丰富的产品组合覆盖云、专用系统、嵌入式和边缘 AI 系统等 产品配
    发表于 06-03 09:14 222次阅读
    <b class='flag-5'>计算机</b>行业携手 <b class='flag-5'>NVIDIA</b> 为新工业革命打造 <b class='flag-5'>AI</b> 工厂和数据中心

    如何选择嵌入式主板或单板计算机

    规格并选择工业主板或嵌入式单板计算机可能是一项耗时且艰巨的任务。本质上,单板计算机和主板都是印刷电路板,承载嵌入式计算机的所有必要组件。传统上,单板
    的头像 发表于 05-21 16:31 852次阅读
    如何选择<b class='flag-5'>嵌入式</b>主板或单板<b class='flag-5'>计算机</b>

    NVIDIA和Recursion利用AI超级计算机加快新药研发

    BioHive 由 NVIDIA AI 驱动,用于加速医疗领域科学家的工作。在全球超级计算机 TOP500 榜单中,它的排名上升了 100 多位。
    的头像 发表于 05-16 09:46 1240次阅读
    <b class='flag-5'>NVIDIA</b>和Recursion利用<b class='flag-5'>AI</b><b class='flag-5'>超级</b><b class='flag-5'>计算机</b>加快新药研发

    人形机器人主板:jetson orin nx核心模块与SOM-7583核心模块结合在一块主板上

    ERUN_7583_ORIN_NX嵌入式人工智能计算机底板,专为满足人形机器人的实际需求而设计,他具备jetson orin nx核心模块与
    的头像 发表于 03-26 11:17 823次阅读
    人形机器人主板:<b class='flag-5'>jetson</b> orin <b class='flag-5'>nx</b>核心模块与SOM-7583核心模块结合在一块主板上

    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成 AI 超级计算

    ——  NVIDIA 于今日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwell
    发表于 03-19 10:56 399次阅读
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成<b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算</b>

    Tesla 计划斥资 5 亿美元建造一台由 NVIDIAAI GPU 提供支持的 Dojo 超级计算机

    ABSTRACT摘要Tesla计划斥资5亿美元建造一台由NVIDIA的AIGPU提供支持的Dojo超级计算机,因此该公司正在加大基于AI的开发力度。JAEALOT2024年1月27日T
    的头像 发表于 02-19 12:45 552次阅读
    Tesla 计划斥资 5 亿美元建造一台由 <b class='flag-5'>NVIDIA</b> 的 <b class='flag-5'>AI</b> GPU 提供支持的 Dojo <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    NVIDIA Jetson嵌入式计算领域探索AI可能

    自动化业务流程、通过数据分析获得洞察力、与客户和员工互动……如今 AI 正在大幅提高生产力,推动竞争优势。NVIDIA Jetson 是适用于自主机器和其他嵌入式应用的先进平台,具有出
    的头像 发表于 01-25 17:03 510次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b>为<b class='flag-5'>嵌入式</b><b class='flag-5'>计算</b>领域探索<b class='flag-5'>AI</b>可能

    什么是嵌入式计算机

    嵌入式计算机是一种专门设计用于特定功能的计算机系统,通常被嵌入到其他设备中,以执行特定的任务。这种计
    的头像 发表于 01-15 15:10 1340次阅读
    什么是<b class='flag-5'>嵌入式计算机</b>?

    NVIDIA Jetson嵌入式系统AI应用

    在这个平台上可以使用多个不同的芯片 ,案例的主角是AIMobile AIM Edge Ncox,一款基于NVIDIA Jetson Orin NX的小型被动冷却嵌入式系统。该系统具有6
    发表于 12-11 17:37 550次阅读