0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用Renesas的RZ/V2系列MPU加速视觉识别系统设计

eeDesigner 2022-11-05 16:52 次阅读

随着边缘视觉识别成为许多产品中越来越重要的功能,机器学习 (ML) 和人工智能AI) 正在进入广泛的应用领域。开发人员面临的问题是,与功耗受限的应用程序相比,支持 ML/AI 的视觉可能需要更多的计算能力来运行识别算法。如果需要昂贵的热管理解决方案,这也会增加成本。

边缘 ML/AI 的目标是找到平衡性能和功耗的最佳架构方法,同时提供强大的软件生态系统来开发应用程序。

考虑到这些条件,本文介绍了瑞萨电子RZ/V2系列微处理器单元(MPU)及其内置AI硬件加速器的解决方案。本文探讨了MPU而不是微控制器MCU)或高端图形处理单元(GPU)如何解决设计人员面临的几个问题。本文介绍了他们如何使用RZ/V2系列开始设计视觉识别系统,以及一些"提示和技巧",以简化这一过程。

RZ/V2 系列 MPU 简介

RZ/V2 系列是一种解决方案,可为使用三核微处理器的开发人员解锁许多功能。RZ/V2L系列微处理器包含两个运行在1.2千兆赫(GHz)的Arm Cortex-A55处理器和一个运行在200兆赫(MHz)的实时微控制器内核(Arm® Cortex-M33®)。此外,该系列中的部件还包含一个基于 Arm Mali-G31 多媒体处理器的 GPU,该处理器具有 NEON 单指令/多数据 (SIMD) 指令。将这三个处理内核与多媒体处理器相结合,为从事视觉识别系统的开发人员提供了全面的解决方案。

目前RZ/V2系列有两种MPU等级,RZ/V2L和RZ/V2M系列。RZ/V2L 具有简单的图像信号处理器 (ISP)、3D 图形引擎和高度通用的外设集。就其本身而言,RZ / V2M增加了一个高性能ISP,支持每秒4帧(fps)的30K分辨率。本文重点介绍RZ/V2L系列,由R9A07G054L23GBG和R9A07G054L24GBG组成。这两部分之间的主要区别在于R9A07G054L23GBG采用15毫米尺寸 ^2^ ,456-LFBGA 封装,而 R9A07G054L24GBG 采用 21 mm 封装 ^2^ ,551-LFBGA 封装。

RZ/V2L系列的框图如图1所示。除了三个处理内核外,MPU 还包括用于标准外设的接口,如 DDR3/DDR4 内存、SPI、USB以太网、I²C、CAN、SCI、GPIO 和模数转换器ADC)。此外,这些部件还包括安全启动、加密引擎和真随机数生成器 (TRNG) 等安全功能。然而,让 MPU 系列与众不同的是动态可重新配置处理器 (DRP) AI 加速器。

瑞萨电子RZ/V2L MPU系列示意图(点击放大)图 1:RZ/V2L MPU 系列支持各种外设接口、安全性和视频处理选项。视觉识别应用的关键特性是DRP-AI加速器。(图片来源:瑞萨电子株式会社)

DRP-AI 加速器秘诀

DRP-AI 加速器是使 RZ/V2L 系列 MPU 能够以更低的能耗和更低的热分布快速执行视觉识别应用的秘诀。DRP-AI 由两个组件组成:DRP 和 AI 乘法累加 (MAC),它们可以通过内部交换机优化数据流来有效地处理卷积网络和全组合层中的操作(图 2)。

DRP-AI 硬件专用于 AI 推理执行。DRP-AI采用瑞萨电子开发的独特动态可重构技术,可提供灵活性、高速处理和能效。此外,DRP-AI 转换器是一种免费软件工具,可让用户实现优化的 AI 模型,从而快速最大限度地提高性能。DRP-AI转换器输出的多个可执行文件可以放置在外部存储器中。然后,应用程序可以在运行时在多个 AI 模型之间动态切换。

DRP 可以通过动态更改硬件配置来快速处理复杂的活动,例如图像预处理和 AI 模型池化层。

瑞萨电子DRP-AI示意图,包括DRP和AI-MAC图 2:DRP-AI 由 DRP 和 AI-MAC 组成,它们可以通过优化内部交换机的数据流,共同有效地处理卷积网络和全组合层中的操作。(图片来源:瑞萨电子株式会社)

DRP-AI 转换器

The DRP-AI Translator tool generates DRP-AI optimized executables from trained ONNX models, independent of any AI framework. For example, a developer could use PyTorch, TensorFlow, or any other AI modeling framework if it outputs an ONNX model. Once the model is trained, it is fed into the DRP-AI Translator, which generates the DRP and AI-MAC executables (Figure 3).

Diagram of AI models are trained using any ONNX compatible frameworkFigure 3: AI models are trained using any ONNX compatible framework. The ONNX model is then fed into the DRP-AI Translator, which generates the DRP and AI-MAC executables. (Image source: Renesas Electronics Corporation)

The DRP-AI Translator has three primary purposes:

  1. Scheduling of each operation to process the AI model.2. Hiding overhead such as memory access time that occurs during each operation's transition in the schedule.3. Optimizing the network graph structure.

The Translator automatically allocates each process of the AI model to the AI-MAC and DRP, thus allowing the user to easily use DRP-AI without being a hardware expert. Instead, the developer can make calls through the supplied driver to run the high-performance AI model. In addition, the DRP-AI translator can continuously update to support newly developed AI models without hardware changes.

系统用例和流程

使用 RZ/V2L MPU 训练和部署视觉识别应用的一般流程如图 4 所示。像往常一样,工程师可以获取他们的数据集并使用它来训练他们的视觉识别模型。无论他们是试图识别猫、购物车中的产品还是装配线上出现故障的零件,训练过程都将使用熟悉的 AI 框架进行。训练模型后,将其转换为 ONNX 格式并馈送到 DRP-AI 转换器,后者又输出可在 DRP-AI 硬件上执行的目标代码。然后,对来自摄像头、加速度计或其他传感器的数据进行采样并馈送到可执行文件中,从而提供运行推理的结果。

训练和运行视觉识别算法的图像图 4:在 RZ/V2L MPU 上训练和运行视觉识别算法的过程。(图片来源:瑞萨电子株式会社)

工程师可以通过多种方式在设计中利用 RZ/V2L MPU(图 5)。首先,RZ/V2L MPU 可用于独立设计,其中 RZ/V2L 是系统中唯一的处理器。凭借其三个内核和AI加速硬件,可能不需要额外的计算能力。

第二个用例是RZ/V2L在更广泛的系统中用作AI处理器。在此用例中,RZ/V2L 运行 AI 推理并将结果返回给另一个处理器或系统,然后由该处理器或系统对该结果进行操作。选择的用例将取决于各种因素,例如成本、整体系统架构、性能和实时响应要求。

![瑞萨电子RZ/V2L MPU的两个用例示意图](//file.elecfans.com/web2/M00/77/AB/poYBAGNkz22AKy4aAABBuflzq2w981.jpg“瑞萨电子RZ/V2L MPU的两个用例”)图 5:RZ/V2L MPU的两个用例是在应用中独立使用它们,或者作为在更广泛的系统中使用的 AI 处理器使用。(图片来源:瑞萨电子株式会社)

实际应用示例

有许多用例可以部署视觉识别技术。一个有趣的例子是在超市。今天,在杂货店结账时,员工或购物者通常会扫描购物车中的每件商品。一个有趣的用例是使用视觉识别检测穿过传送带的产品并自动收费。

可以使用简单的CMOS相机和瑞萨电子的[RTK9754L23S01000BE](https://www.digikey.com/en/products/detail/renesas-electronics-america-inc/RTK9754L23S01000BE/16187521)评估板构建原型(图6)。RZ/V2L 嵌入式开发板具有模块系统 (SOM) 和载板,使开发人员能够快速启动和运行。此外,该开发板还支持Linux以及DRP-AI转换器等各种工具。

![瑞萨电子RZ/V2L嵌入式开发板图像](https://www.digikey.com/-/media/Images/Article%20Library/TechZone%20Articles/2022/September/Accelerate%20Vision%20Recognition%20System%20Design/article-2022september-accelerate-vision-recognition-system_fig6.jpg?la=en&ts=203d0787-6ae7-4716-8e1f-00dce15d82f9“Renesas RZ/V2L嵌入式开发板”)*图 6:RZ/V2L 嵌入式开发板具有 SOM和载板,使开发人员能够快速启动和运行。(图片来源:瑞萨电子株式会社)*

图 7 显示了获取图像数据和生成 AI 结果所需的操作概述。在本应用示例中,传送带的图像使用CMOS传感器通过板载ISP拍摄。接下来,将图像保存到内存中并输入DRP-AI引擎。最后,DRP-AI 引擎运行推理并提供 AI 结果。例如,结果可能是发现了香蕉、苹果或其他水果。

结果通常伴随着 0 到 1 的置信水平。例如,0.90 置信度表示 AI 确信它检测到了一个苹果。另一方面,0.52的置信度可能意味着人工智能认为它是一个苹果,但不确定。获取 AI 结果并在多个样本中平均以提高获得正确结果的机会的情况并不少见。

![瑞萨电子RZ/V2L嵌入式开发板示意图](file.elecfans.com/web2/M00/77/AB/poYBAGNkz2-ADWgeAABVKqnBB7g602.jpg“瑞萨电子RZ/V2L嵌入式开发板”)图 7:RZ/V2L 嵌入式开发板用于运行 AI 推理,以识别传送带上的各种水果。该图演示了获取图像并生成 AI 结果所需的步骤。(图片来源:瑞萨电子株式会社)

最后,在本例中,在检测到的对象周围绘制一个框,并显示识别对象的名称以及置信度(图 8)。

![瑞萨电子RZ/V2L的输出示例](https://www.digikey.com/-/media/Images/Article%20Library/TechZone%20Articles/2022/September/Accelerate%20Vision%20Recognition%20System%20Design/article-2022september-accelerate-vision-recognition-system_fig8.jpg?la=en&ts=06c253a5-b285-4dda-a005-be06d4026a2e“来自瑞萨电子RZ/V2L的输出”)*图 8:RZ/V2L 在检测传送带上的水果和蔬菜的应用中的示例输出。(图片来源:瑞萨电子株式会社)*

开始使用 RZ/V2L 的提示和技巧

希望在瑞萨电子RZ/V2L MPU上开始机器学习的开发人员会发现,他们有大量资源可以利用来启动和运行。以下是开发人员应牢记的几个"提示和技巧",可以简化和加快他们的开发:

  • 从开发板和现有示例开始,了解部署和运行应用程序的情况。*如果需要执行多个推理,请将可执行模型保存到外部存储器,并使用 DRP-AI 功能在模型之间快速切换。*查看瑞萨电子RZ/V嵌入式AI MPU网站上的文档和视频。*下载[DRP-AI 转换器](https://www.renesas.com/us/en/products/microcontrollers-microprocessors/rz-arm-based-high-end-32-64-bit-mpus/drp-ai-translator)。*下载 RZ/V2L[DRP-AI 支持包](https://www.renesas.com/us/en/products/microcontrollers-microprocessors/rz-arm-based-high-end-32-64-bit-mpus/rzv2l-drp-ai-support-package)。

遵循这些"提示和技巧"的开发人员在开始时将节省相当多的时间和悲伤。

结论

ML 和 AI 正在进入许多边缘应用,实时识别对象的能力变得越来越重要。对于设计人员来说,困难在于找到合适的架构来在边缘执行 AI/ML。GPU 往往耗电,而 MCU 可能没有足够的计算能力。

如图所示,采用DRP-AI的瑞萨电子RZ/V MPU系列具有硬件加速AI等多个优势,以及大量的工具链和原型设计支持。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29962

    浏览量

    268273
  • MPU
    MPU
    +关注

    关注

    0

    文章

    342

    浏览量

    48713
  • 视觉识别
    +关注

    关注

    3

    文章

    89

    浏览量

    16679
  • Renesas
    +关注

    关注

    0

    文章

    1757

    浏览量

    22610
  • 机器学习
    +关注

    关注

    66

    文章

    8370

    浏览量

    132368
收藏 人收藏

    评论

    相关推荐

    瑞萨RZ/G系列通用MPU产品介绍

    RZ/G系列是基于Arm CortexA5x架构和RISC-V架构的可扩展MPU平台,具有先进的图形、视频引擎和高速接口。RZ/G
    的头像 发表于 10-25 10:50 192次阅读
    瑞萨<b class='flag-5'>RZ</b>/G<b class='flag-5'>系列</b>通用<b class='flag-5'>MPU</b>产品介绍

    瑞萨RZ/T系列MPU的中断重入实现

    基于Arm的RZ/T系列MPU通过工业以太网通信提供高性能和高速实时控制,为自动化市场构建高性能系统RZ/T
    的头像 发表于 07-23 14:47 503次阅读
    瑞萨<b class='flag-5'>RZ</b>/T<b class='flag-5'>系列</b><b class='flag-5'>MPU</b>的中断重入实现

    多目标智能识别系统

    智慧华盛恒辉多目标智能识别系统是一种利用现代计算机视觉技术和人工智能算法,从图像或视频中同时识别和分类多个目标物体的系统。这种
    的头像 发表于 07-16 10:42 1.2w次阅读

    基于瑞萨RZ/V2H AI微处理器的解决方案:高性能视觉AI系统

    复杂的实时物体识别及推理,同时功耗可与传统的嵌入式MPU相媲美,无需冷却风扇。这里介绍基于RZ/V2H的解决方案:高性能视觉AI
    发表于 07-02 18:36 446次阅读
    基于瑞萨<b class='flag-5'>RZ</b>/<b class='flag-5'>V2</b>H AI微处理器的解决方案:高性能<b class='flag-5'>视觉</b>AI<b class='flag-5'>系统</b>

    产品简介 | RZ/A系列MPU

    产品简介 | RZ/A系列MPU
    的头像 发表于 05-24 08:06 399次阅读
    产品简介 | <b class='flag-5'>RZ</b>/A<b class='flag-5'>系列</b><b class='flag-5'>MPU</b>

    产品简介 | RZ/V2系列MPU

    产品简介 | RZ/V2系列MPU
    的头像 发表于 05-08 08:06 392次阅读
    产品简介 | <b class='flag-5'>RZ</b>/<b class='flag-5'>V2</b><b class='flag-5'>系列</b><b class='flag-5'>MPU</b>

    面向边缘AI应用的全新RZ/V2H

    一款新的64位 MPU RZ/V2H ,为瑞萨电子的RZ/V系列带来了针对边缘AI的重大升级。边
    的头像 发表于 05-07 14:56 7380次阅读
    面向边缘AI应用的全新<b class='flag-5'>RZ</b>/<b class='flag-5'>V2</b>H

    产品简介 | RZ/G2系列MPU

    产品简介 | RZ/G2系列MPU
    的头像 发表于 04-29 08:08 332次阅读
    产品简介 | <b class='flag-5'>RZ</b>/G<b class='flag-5'>2</b><b class='flag-5'>系列</b><b class='flag-5'>MPU</b>

    产品详解 | 瑞萨电子RZ/N2L MPU

    产品详解 | 瑞萨电子RZ/N2L MPU
    的头像 发表于 04-20 08:06 679次阅读
    产品详解 | 瑞萨电子<b class='flag-5'>RZ</b>/N<b class='flag-5'>2</b>L <b class='flag-5'>MPU</b>

    产品详解 | 瑞萨电子RZ/T2L MPU

    产品详解 | 瑞萨电子RZ/T2L MPU
    的头像 发表于 03-21 08:05 374次阅读
    产品详解 | 瑞萨电子<b class='flag-5'>RZ</b>/T<b class='flag-5'>2</b>L <b class='flag-5'>MPU</b>

    产品详解 | 瑞萨电子RZ/T2M MPU

    产品详解 | 瑞萨电子RZ/T2M MPU
    的头像 发表于 03-13 08:05 567次阅读
    产品详解 | 瑞萨电子<b class='flag-5'>RZ</b>/T<b class='flag-5'>2</b>M <b class='flag-5'>MPU</b>

    瑞萨电子推出功能强大的单芯片RZ/V2H MPU

    瑞萨电子针对下一代机器人领域的需求,推出了一款功能强大的单芯片RZ/V2H MPU。这款芯片是瑞萨电子在技术创新上的又一重要成果,它专为具备视觉AI和实时控制功能的机器人设计,将助力机
    的头像 发表于 03-08 11:01 1064次阅读

    瑞萨RZ/V系列产品介绍

    目前,AI应用已渗透在工业及消费类产品的各个领域,提供客户更好的功能及帮助降低成本。在瑞萨RZ MPU产品整容中,RZ/V系列是专门提供面向
    的头像 发表于 01-16 12:15 1026次阅读
    瑞萨<b class='flag-5'>RZ</b>/<b class='flag-5'>V</b><b class='flag-5'>系列</b>产品介绍

    RZ/T、RZ/N系列MPU芯片启动注意事项

    RZ/T、RZ/N系列MPU有3路电源域,在启动时,外围设备也需要进行不同电源域的配置,所以电源时序,复位信号,以及系统管脚的配置都会影响芯
    的头像 发表于 01-05 12:20 1258次阅读
    <b class='flag-5'>RZ</b>/T、<b class='flag-5'>RZ</b>/N<b class='flag-5'>系列</b><b class='flag-5'>MPU</b>芯片启动注意事项

    基于RZ/V2L AI MPU的人头计数应用

    瑞萨基于RZ/V2L AI MPU开发了大量可拿来即用的AI应用程序,并提供源代码、预编译应用程序二进制文件和预训练的人工智能模型对象。您可以从各种用例中选择感兴趣的应用程序,并立即在RZ
    的头像 发表于 12-15 13:49 600次阅读