0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RK3576开发板NPU激发无限创新!体验6TOPS强劲性能的奇妙之旅

Rockchip系列教程 来源:Rockchip系列教程 作者:Rockchip系列教程 2024-05-24 10:01 次阅读

RKNN SDK 快速上手指南

开发板:ArmSoM-W3,ArmSoM-Sige7,ArmSoM-Sige5,ArmSoM-AIM7

OS:Debian11/12

目的:本文介绍如何使用rk的npu sdk。

作为瑞芯微8nm高性能AIOT平台,RK3576/RK3588 NPU性能可谓十分强大,6TOPS设计能够实现高效的神经网络推理计算。这使得RK3576/RK3588在图像识别、语音识别、自然语言处理等人工智能领域有着极高的性能表现。

此外,RK3576/RK3588 的NPU还支持多种学习框架,包括TensorFlow,Pytorch、Caffe、MXNet等在人工智能开发中流行的深度学习框架,能够为开发者提供丰富的工具和库,使他们能够方便地进行模型训练和推理,可轻松应对各种大数据运算场景。​​

wKgaomZF-x2AYuioAAMTtj0YiGw573.pngrk3576 npu

RK3576/RK3588 NPU典型应用​

计算机视觉(Computer Vision):NPU可用于图像识别、目标检测、人脸识别等任务。在安防监控、自动驾驶、医疗影像分析等领域中有着广泛的应用。

自然语言处理(Natural Language Processing,NLP):NPU可加速文本分类、情感分析、机器翻译等任务,使得处理大规模文本数据变得更高效。

语音识别与处理(Speech Recognition and Processing):在语音识别、语音合成等方面,NPU可以提高处理速度和准确性,应用于智能语音助手、语音交互系统等场景。

智能家居物联网IoT):NPU的低功耗特性使其适用于智能家居设备、智能监控摄像头、智能穿戴设备等物联网应用,从而实现设备的智能化和自动化。

医疗健康:在医学影像分析、疾病诊断、基因组学等领域,NPU可以加速大规模数据的处理和分析,帮助医疗工作者更准确地诊断疾病和制定治疗方案。

智能交通:在智能交通系统中,NPU可用于车辆识别、交通流量监控、智能交通信号灯控制等任务,提升交通系统的效率和安全性。

Rockchip NPU SDK​

rockchip的npu sdk分为两个部分,PC端使用的是rknn-toolkit2,可以在PC端进行模型转换,推理以及性能评估。具体来说是把主流的模型如Caffe、TensorFlow、TensorFlow Lite、ONNX、DarkNet、PyTorch 等转换为RKNN模型,并可以在PC端使用这个RKNN模型进行推理仿真,计算时间和内存开销。板端还有一部分,就是rknn runtime环境,包含一组C API库以及与NPU进行通信的驱动模块,可执行程序等。

RKNN软件栈可以帮助用户快速将AI模型部署到瑞芯微芯片上。整体框架如下:

wKgaomZF_HiAVAovAAEwvVxHP9Y037.png

为了使用 RKNPU,用户需要首先在计算机上运行 RKNN-Toolkit2 工具,将训练好的模型转换为 RKNN 格式的模型,然后使用 RKNN C API 或 Python API 在开发板上进行推理。

RKNN-Toolkit2是一款软件开发套件,供用户在PC和瑞芯微NPU平台上进行模型转换、推理和性能评估。

RKNN-Toolkit-Lite2为瑞芯微NPU平台提供Python编程接口,帮助用户部署RKNN模型,加速AI应用落地。

RKNN Runtime为Rockchip NPU平台提供C/C++编程接口,帮助用户部署RKNN模型,加速AI应用的落地。

RKNPU内核驱动负责与NPU硬件交互。它已经开源,可以在Rockchip内核代码中找到。

提示

RKNPU2 SDK v2.0.0-beta (for RK3576/RK3562/RK3566/RK3568/RK3588/RV1103/RV1106) https://github.com/airockchip/rknn-toolkit2

Model zoo: https://github.com/airockchip/rknn_model_zoo

docs: https://github.com/airockchip/rknn-toolkit2/tree/master/doc

RK3576/RK3588 NPU使用案例分享​

导出rknn模型步骤

请参考 https://github.com/airockchip/rknn_model_zoo/tree/main/models/CV/object_detection/yolo

注意事项​

使用rknn-toolkit2版本大于等于1.4.0。

切换成自己训练的模型时,请注意对齐anchor等后处理参数,否则会导致后处理解析出错。

官网和rk预训练模型都是检测80类的目标,如果自己训练的模型,需要更改include/postprocess.h中的OBJ_CLASS_NUM以及NMS_THRESH,BOX_THRESH后处理参数。

demo需要librga.so的支持,编译使用请参考 https://github.com/airockchip/librga

由于硬件限制,该demo的模型默认把 yolov5 模型的后处理部分,移至cpu实现。本demo附带的模型均使用relu为激活函数,相比silu激活函数精度略微下降,性能大幅上升。

Android Demo​

编译​

首先导入ANDROID_NDK_PATH,例如export ANDROID_NDK_PATH=~/opts/ndk/android-ndk-r18b,然后执行如下命令:

./build-android.sh -t < target > -a < arch > [-b ]# 例如: ./build-android.sh -t rk3568 -a arm64-v8a -b Release

推送执行文件到板子​

连接板子的usb口到PC,将整个demo目录到 /data:

adb rootadb remountadb push install/rknn_yolov5_demo /data/

运行​

adb shellcd /data/rknn_yolov5_demo/export LD_LIBRARY_PATH=./lib./rknn_yolov5_demo model/< TARGET_PLATFORM >/yolov5s-640-640.rknn model/bus.jpg

Aarch64 Linux Demo​

编译​

首先导入GCC_COMPILER,例如export GCC_COMPILER=~/opt/gcc-linaro-7.5.0-2019.12-x86_64_aarch64-linux-gnu/bin/aarch64-linux-gnu ,然后执行如下命令:

./build-linux.sh -t < target > -a < arch > -b ]# 例如: ./build-linux.sh -t rk3588 -a aarch64 -b Release

推送执行文件到板子​

将 install/rknn_yolov5_demo_Linux 拷贝到板子的/userdata/目录.

如果使用rockchip的EVB板子,可以使用adb将文件推到板子上:

adb push install/rknn_yolov5_demo_Linux /userdata/

如果使用其他板子,可以使用scp等方式将install/rknn_yolov5_demo_Linux拷贝到板子的/userdata/目录

运行​

adb shellcd /userdata/rknn_yolov5_demo_Linux/export LD_LIBRARY_PATH=./lib./rknn_yolov5_demo model/< TARGET_PLATFORM >/yolov5s-640-640.rknn model/bus.jpg

Note: Try searching the location of librga.so and add it to LD_LIBRARY_PATH if the librga.so is not found on the lib folder. Using the following commands to add to LD_LIBRARY_PATH.

export LD_LIBRARY_PATH=./lib:< LOCATION_LIBRGA.SO >

视频流Demo运行命令参考如下:​

h264视频

./rknn_yolov5_video_demo model/< TARGET_PLATFORM >/yolov5s-640-640.rknn xxx.h264 264

注意需要使用h264码流视频,可以使用如下命令转换得到:

ffmpeg -i xxx.mp4 -vcodec h264 xxx.h264

h265视频

./rknn_yolov5_video_demo model/< TARGET_PLATFORM >/yolov5s-640-640.rknn xxx.hevc 265

注意需要使用h265码流视频,可以使用如下命令转换得到:

ffmpeg -i xxx.mp4 -vcodec hevc xxx.hevc

rtsp视频流

./rknn_yolov5_video_demo model/< TARGET_PLATFORM >/yolov5s-640-640.rknn < RTSP_URL > 265
wKgZomZF_NGAV2FjABCAAk9GjPM001.png

注意​

需要根据系统的rga驱动选择正确的librga库,具体依赖请参考: https://github.com/airockchip/librga

rk3562 目前仅支持h264视频流

rtsp 视频流Demo仅在Linux系统上支持,Android上目前还不支持

视频流输入的h264名称不能为"out.h264",会被覆盖

演示视频​

https://www.bilibili.com/video/BV1jt421M7Pj/

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开发板
    +关注

    关注

    25

    文章

    5024

    浏览量

    97353
  • NPU
    NPU
    +关注

    关注

    2

    文章

    277

    浏览量

    18581
  • rk3576
    +关注

    关注

    1

    文章

    47

    浏览量

    120
收藏 人收藏

    评论

    相关推荐

    RK3588与RK3576区别解析

    RK3588是四核A76@2.4GHz + 四核A55@1.8GHz。 NPU:均内置 6TOPS NPU,但RK3588数据类型支持更丰
    的头像 发表于 12-17 14:03 98次阅读
    <b class='flag-5'>RK</b>3588与<b class='flag-5'>RK3576</b>区别解析

    敬请期待 | 迅为RK3576开发板即将发布

    敬请期待 | 迅为RK3576开发板即将发布
    的头像 发表于 11-22 15:13 125次阅读
    敬请期待 | 迅为<b class='flag-5'>RK3576</b><b class='flag-5'>开发板</b>即将发布

    追加名额丨米尔瑞芯微RK3576开发板有奖试用

    米尔与瑞芯微合作发布的新品基于瑞芯微RK3576应用处理器的MYD-LR3576开发板免费试用活动加码啦~~米尔追加了2块价值849元的MYD-LR3576
    的头像 发表于 11-22 01:00 153次阅读
    追加名额丨米尔瑞芯微<b class='flag-5'>RK3576</b><b class='flag-5'>开发板</b>有奖试用

    米尔RK3576开发板特惠活动!

    近日,米尔电子发布基于瑞芯微RK3576核心开发板RK3576作为国产热门处理器,其高性能数据处理能力、领先的AI智能分析、强大的扩展
    的头像 发表于 11-12 01:00 235次阅读
    米尔<b class='flag-5'>RK3576</b><b class='flag-5'>开发板</b>特惠活动!

    RK3576开发板介绍

    ArmSoM-Sige5 RK3576 开发板   ArmSoM-Sige5 采用第二代 8nm 高性能 AIOT 平台 Rockchip RK3576,拥有
    的头像 发表于 11-04 10:10 204次阅读
    <b class='flag-5'>RK3576</b><b class='flag-5'>开发板</b>介绍

    新品体验 | RK3576开发板

    前言:RK3576作为瑞芯微第二代8nm高性能AIOT平台,一经推出便获得了极大的关注。广州眺望电子科技有限公司是一家专注于嵌入式处理器模组研发与应用的国家高新技术企业,目前公司已推出的相关型号有
    的头像 发表于 11-01 08:08 641次阅读
    新品体验 | <b class='flag-5'>RK3576</b><b class='flag-5'>开发板</b>

    低功耗长续航,解锁RK3576卓越性能

    搭载新一代八核AIOT处理器RK3576,采用先进工艺制程,内置ARMMaliG52MC3GPU,集成6TOPS算力NPU,支持主流大模型的私有化部署。具备强大的高清高帧率显示能力,支持外部看门狗
    的头像 发表于 10-31 08:00 344次阅读
    低功耗长续航,解锁<b class='flag-5'>RK3576</b>卓越<b class='flag-5'>性能</b>

    瑞芯微系列-米尔RK3576核心-8核6T高算力AI开发板

    MYC-LR3576核心开发板瑞芯微RK3576处理器,8核6T高算力赋能工业AI智能化AI边缘应用:搭载
    发表于 10-29 10:16 3次下载

    基于瑞芯微RK3576的智能仓储转型:高效与自动化的全新标准

    核心,搭载瑞芯微RK3576处理器,具备多摄像头支持、AI处理能力和6TOPSNPU算力。凭借这些技术优势,HZ-CORE-RK3576
    的头像 发表于 10-13 08:09 299次阅读
    基于瑞芯微<b class='flag-5'>RK3576</b>的智能仓储转型:高效与自动化的全新标准

    Firefly推出RK3576系列智能产品

    今年瑞芯微推出了新一代八核64位AIOT芯片RK3576,采用大小核构架,先进工艺制程,内置ARMMaliG52MC3GPU,集成6TOPS算力NPU。支持Transformer架构下的私有化部署
    的头像 发表于 07-26 08:02 708次阅读
    Firefly推出<b class='flag-5'>RK3576</b>系列智能产品

    性能低功耗:RK3576全系智能产品

    瑞芯微全新一代芯片RK3576,采用先进的8nm制程设计工艺,具有高性能低功耗的特点,搭载6TOPs算力NPU,人工智能计算效率获得显著提升。同时提升了ISP、视频编解码、视频后处理的
    的头像 发表于 06-19 08:02 1808次阅读
    高<b class='flag-5'>性能</b>低功耗:<b class='flag-5'>RK3576</b>全系智能产品

    贝启RK3576核心/开发板

    贝启RK3576核心/开发板,采用瑞芯微新一代RK3576平台处理器,搭载四个A72核心+四个A53核心,同时支持Cortex-M0@400MhzMCU和4TopsAI
    的头像 发表于 04-29 08:21 3030次阅读
    贝启<b class='flag-5'>RK3576</b>核心<b class='flag-5'>板</b>/<b class='flag-5'>开发板</b>

    RK3576:革新智能设备体验的高性能AI芯片

    在当前竞争激烈的智能设备市场中,高性能与低功耗的芯片已然成为各大产品追求的关键优势。瑞芯微最新推出的RK3576芯片拥有强大的竞争力。这款芯片搭载了保持6TOPS算力的NPU,同时支持
    的头像 发表于 04-26 08:33 1766次阅读
    <b class='flag-5'>RK3576</b>:革新智能设备体验的高<b class='flag-5'>性能</b>AI芯片

    瑞芯微第二代8nm高性能AIOT平台 RK3576 详细介绍

    RK3576处理器 RK3576瑞芯微第二代8nm高性能AIOT平台,它集成了独立的6TOPS(Tera Operations Per Second,每秒万亿次操作)
    发表于 03-12 13:45

    超详细!瑞芯微第二代8nm高性能AIOT平台 RK3576 参数介绍

    RK3576瑞芯微第二代8nm高性能AIOT平台,它集成了独立的6TOPS(Tera Operations Per Second,每秒万亿次操作)NPU(神经网络处理单元),用于处理人
    的头像 发表于 03-06 18:02 9658次阅读
    超详细!瑞芯微第二代8nm高<b class='flag-5'>性能</b>AIOT平台 <b class='flag-5'>RK3576</b> 参数介绍