最近的视觉AI模型必须处理动态和复杂的环境,因此在实时应用中需要更高的能效和速度。
为了满足市场需求,瑞萨发布了下一代动态可重构人工智能处理器(DRP-AI)加速器。DRP-AI加速器提供10 TOPS/W的高功率效率,比传统技术高出10倍,它可以在低功耗的传统嵌入式处理器(MPU)上面运行复杂的图像AI模型,而不需要像以前一样采用高功耗的GPU来运行。
除了这个AI加速器外,高端RZ/V2H MPU还配备了使用动态可重构处理器(DRP)的图像处理加速器、运行频率高达1.8GHz的四核Linux处理器Arm Cortex-A55、双核800MHz Arm Cortex-R8高速实时处理器和I/O处理Arm Cortex-M33子内核,采用异构多处理器配置。
动态可重构处理器(DRP)
七个基于Arm的CPU内核、下一代DRP-AI和DRP的组合,可以立即处理机械控制中的图像识别和AI判断结果,使其成为下一代自主机器人、自主移动机器人、无人机和其他应用的理想AI处理器。
下一代AI加速器DRP-AI
RZ/V2M、RZ/V2L和RZ/V2MA嵌入了瑞萨电子独创的DRP-AI加速器,但瑞萨已将其独创的AI加速器DRP-AI升级为下一代,以满足最近的市场需求。
为了大幅提高电源效率,DRP-AI应用了INT8量化和硬件支持,用于非结构化修剪,这是传统AI加速器难以实现的,以实现高达80 TOPS的推理性能和10 TOPS/W的电源效率。
下一代高能效AI加速器(DRP-AI3):自治系统高级AI中的嵌入式处理速度提高10倍”白皮书
下图1显示了AI推理性能与其他RZ/V产品的比较。以ResNet-50为例,典型的分类卷积神经网络(CNN)的性能比不修剪的RZ/V2L高14倍(密集模型),采用模型修剪后的RZ/V2H比RZ/V2L(密集模型)性能高45倍。
图1 RZ/V系列AI推理性能(不包括前/后处理)
通过动态可重构处理器DRP打开CV加速
甚至在深度学习出现之前,各种方法就已被用于图像识别和决策的应用中。OpenCV这个开源的计算机视觉库就是这样一个例子。即使现在有了AI图像处理,OpenCV仍然是一项非常有用的技术。Vision AI和OpenCV现在都在适当的场景一起使用。
为了加速AI和OpenCV等各种图像处理算法,RZ/V2H MPU设计了与DRP-AI分离的动态可重构处理器,为OpenCV加速器提供DRP库,充分利用其灵活性。
图2比较了具有DRP的OpenCV加速器与RZ/V2H四核CPU的性能。例如,通过使用DRP加速,用于图像边缘检测的Sobel滤波器从7.6fps提高到123fps的速度,提高了16倍。
图2 OpenCV加速器性能基准测试
AI异构配置+高速实时控制
虽然快速多核Linux处理器是图像AI的最佳选择,但它需要大量的内存资源,并且很难实现机械控制所需的亚毫秒级实时性能。
为了解决这个问题,RZ/V2H使用四核Cortex-A55来运行包括AI处理在内的Linux程序,并使用专用的高速实时处理器在需要高实时性能的应用(如电机控制)中进行RTOS处理。
通过使用OpenAMP进行处理器间不同操作系统的通信连接,DRP-AI和Linux处理器做出的决策结果可以反映在RTOS处理器的实时机械控制中。
图3 RZ/V2H框图
具有这些独特功能的RZ/V2H嵌入式AI微处理器已投入量产,RZ/V2H评估板也可用于快速启动您的下一个视觉AI开发。
审核编辑:刘清
-
处理器
+关注
关注
68文章
19461浏览量
231418 -
机器人
+关注
关注
211文章
28745浏览量
208913 -
加速器
+关注
关注
2文章
809浏览量
38162 -
MPU
+关注
关注
0文章
376浏览量
49008 -
人工智能
+关注
关注
1797文章
47867浏览量
240853
原文标题:RZ/V2H MPU提高了机器人和自主应用中的AI性能和实时控制
文章出处:【微信号:瑞萨MCU小百科,微信公众号:瑞萨MCU小百科】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
苹果加入UALink联盟,共推AI加速器新标准
AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感
《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得
Samtec AI 应用详述 | 人工智能加速器所需的连接器
![Samtec <b class='flag-5'>AI</b> 应用详述 | <b class='flag-5'>人工智能</b><b class='flag-5'>加速器</b>所需的连接<b class='flag-5'>器</b>](https://file1.elecfans.com/web2/M00/09/7B/wKgaomb46hWAfggOAABuUk8Jd1o594.jpg)
risc-v在人工智能图像处理应用前景分析
IBM发布Telum II处理器:DPU性能飙升70%,引领技术创新浪潮
下一代高功能新一代AI加速器(DRP-AI3):10x在高级AI系统高级AI中更快的嵌入处理
![<b class='flag-5'>下一代</b>高功能新<b class='flag-5'>一代</b><b class='flag-5'>AI</b><b class='flag-5'>加速器</b>(<b class='flag-5'>DRP-AI</b>3):10x在高级<b class='flag-5'>AI</b>系统高级<b class='flag-5'>AI</b>中更快的嵌入<b class='flag-5'>处理</b>](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
基于瑞萨RZ/V2H AI微处理器的解决方案:高性能视觉AI系统
![基于<b class='flag-5'>瑞</b><b class='flag-5'>萨</b>RZ/V2H <b class='flag-5'>AI</b>微<b class='flag-5'>处理器</b>的解决方案:高性能视觉<b class='flag-5'>AI</b>系统](https://file1.elecfans.com/web2/M00/F7/28/wKgZomaD21SAbKA6AADrJjvRsaM578.png)
瑞萨高性能AI加速处理器DRP-AI解析
![<b class='flag-5'>瑞</b><b class='flag-5'>萨</b>高性能<b class='flag-5'>AI</b><b class='flag-5'>加速</b><b class='flag-5'>处理器</b><b class='flag-5'>DRP-AI</b>解析](https://file1.elecfans.com/web2/M00/ED/3C/wKgZomZqXh-AIq_lAAAcYhJQkWM717.png)
评论