旭日X3派AI推理（YOLOv5测试）-电子发烧友网

X3芯片概述

BPU是地平线自研的AI加速核，在设计过程中具体结合了AIoT/Auto的场景需求，从算法、计算架构、编译器三个方面进行了软硬协同优化，使得在功耗不变前提下提高数倍的AI计算性能。
X3和J3芯片各内置了两个伯努利2.0的BPU核，它极大提升了对先进CNN网络的支持，同时大大降低了DDR带宽占用率，可提供实时像素级视频分割和结构化视频分析等能力。

详细的内容请参考地平线芯片开发手册

1.图片分类任务

这里主要对样例中提供的程序进行测试

首先是系统中提供的图片分类任务样例

cd /app/ai_inference/01_basic_sample/
sudo python3 ./test_mobilenetv1.py

在test_mobilenetv1.py中对斑马的图片进行了分类，得到的结果如下，通过查看标签编号340: 'zebra'实现了对图片的准确分类。

========== Classification result ==========
cls id: 340 Confidence: 0.991851

为了简单测试下分类算法的结果。使用其他图片进行测试，发现在特征明显时图片分类准确度较高，如对背景干净，特征清晰的金鱼达到了0.999884的置信度，1: 'goldfish, Carassius auratus'，也存在图片分类错误的情况存在，如对于玉米进行检测时998: 'ear, spike, capitulum'。

========== Classification result ==========
cls id: 1 Confidence: 0.999884

========== Classification result ==========
cls id: 998 Confidence: 0.753721

2.fcos目标检测快速验证

使用目标检测样例

cd /app/ai_inference/02_usb_camera_sample/
python3 usb_camera_fcos.py

在初探中已经对其进行简单展示，这里将代码进行简单分析，主要包括以下5个部分

其中加载模型和模型正演为地平线封装的模型方法，from hobot_dnn import pyeasy_dnn as dnn

hdmi显示时地平线封装的vio方法，from hobot_vio import libsrcampy as srcampy

加载的模型是通过地平线工具链编译的bin模型fcos_512x512_nv12.bin，在运行中会对输入和输出的tensor进行打印，可以看出输入的是512x512的图像信息，输入为15个tensor，其中输出包括了检测框坐标、类别、置信度得分等。

tensor type: NV12_SEPARATE
data type: uint8
layout: NCHW
shape: (1, 3, 512, 512)
15
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 64, 64, 80)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 32, 32, 80)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 16, 16, 80)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 8, 8, 80)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 4, 4, 80)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 64, 64, 4)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 32, 32, 4)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 16, 16, 4)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 8, 8, 4)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 4, 4, 4)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 64, 64, 1)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 32, 32, 1)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 16, 16, 1)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 8, 8, 1)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 4, 4, 1)

3.改用YOLOv5进行目标检测

更换YOLOv5模型进行目标检测，由于工具链中提供了编译后的YOLOv5模型，这里可以对其直接使用，工具链相关资料在AI工具链资料包其中

horizon_xj3_open_explorer_v1.11.4_20220413\ddk\samples\ai_toolchain\model_zoo\runtime\yolov5

直接在usb_camera_fcos.py中进行模型的替换

models = dnn.load('../models/yolov5_672x672_nv12.bin')

对输入输出进行打印，可以看到输入是一个 (1, 3, 672, 672)的tensor，而输出为3层的tensor，输出的不同代表着需要对模型后处理进行重写。

tensor type: NV12_SEPARATE
data type: uint8
layout: NCHW
shape: (1, 3, 672, 672)
3
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 84, 84, 255)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 42, 42, 255)
tensor type: float32
data type: float32
layout: NHWC
shape: (1, 21, 21, 255)

在这里我找到之前地平线对YOLOv5的后处理的相关代码和说明，这个位于\horizon_xj3_open_explorer_v1.11.4_20220413\ddk\samples\ai_toolchain\horizon_model_convert_sample\04_detection\03_yolov5\mapper

1.4 对于 YOLOv5 模型，我们在模型结构上的修改点主要在于几个输出节点处。由于目前的浮点转换工具链暂时不支持 5 维的 Reshape，所以我们在 prototxt中进行了删除，并将其移至后处理中执行。同时我们还添加了一个 transpose 算子，使该节点将以 NHWC 进行输出。这是因为在地平线芯片中， BPU 硬件本身以 NHWC 的layout 运行，这样修改后可以让 BPU 直接输出结果，而不在量化模型中引入额外的transpose。详情请见文档中benchmark部分的图文介绍

根据说明可以看到YOLOv5应该属于异构量化，部分网络在后处理中执行，这也就代表需要更多的处理时间。在对于样例中给出的fcos的代码，我们主要在后处理处做出相应的调整，并将类别展示做出更换，其中主要代码也是参考了地平线中给出的YOLOv5的公开代码，做了部分的修改。

检测结果：

运行指令

python3 usb_camera_yolov5.py

将检测结果输出，可以看到对环境中的大部分物品做出了及时的检测，置信度也很高。

对时间进行统计，检测的时间根据实际环境中的复杂度变化而变化，经过实际测试发现在0.5s~0.8s之间，检测结果较快。主要对cv_time（获取图像并缩放到模型的输入尺寸）、forward_time（模型的正向推演）、postprocess_time（后处理）时间进行了统计，其中模型量化后的时间主要是Forward_time，可以看到需要的时间较短，表明模型的量化有效的减少了检测时间。占用的时间主要集中在后处理和显示，还有优化的空间。

time: 0.8004379272460938
cv_time         =  0.15749073028564453
Forward_time    =  0.06625533103942871
postprocess_time=  0.38094043731689453
chair is in the picture with confidence:0.8259
pottedplant is in the picture with confidence:0.7951
tvmonitor is in the picture with confidence:0.7798
tvmonitor is in the picture with confidence:0.4708
tvmonitor is in the picture with confidence:0.4420
time: 0.8241267204284668
cv_time         =  0.1624467372894287
Forward_time    =  0.06629300117492676
postprocess_time=  0.3649098873138428
chair is in the picture with confidence:0.6791
pottedplant is in the picture with confidence:0.7784
tvmonitor is in the picture with confidence:0.7809
tvmonitor is in the picture with confidence:0.5400

4.使用工具链量化模型

查看工具链介绍主要有以下两种方式：

这里使用浮点转定点工具链，这种方法适用于最多的模型，详细介绍可以去查看数据链的视频。使用wegt下在docker文件，安装docker读取镜像

docker image ls
docker run -it hub.hobot.cc/aitools/ai_toolchain_centos_7_xj3:v2.1.7 /bin/bash

这里发现其中有YOLOv5s的相关内容，使用该模型进行快速部署

cd /open_explorer/horizon_xj3_open_explorer_v2.1.7_20220520/ddk/samples/ai_toolchain/horizon_model_convert_sample/04_detection/03_yolov5s/mapper
bash 01_check.sh
bash 02_preprocess.sh
bash 03_build.sh   #此步骤需要耗费一定时间

在model_output中输出了yolov5s_672x672_nv12.bin ，由于输出模型一致，直接在板子代码中修改运行，得到了与YOLO相似的效果。

原作者：Tobark

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

嵌入式

嵌入式

+关注

关注
5099

文章
19246

浏览量
309359
AI

AI

+关注

关注
87

文章
32173

浏览量
271224
人工智能

人工智能

+关注

关注
1799

文章
47999

浏览量
241737

【米尔RK3576开发板评测】+项目名称YOLOV5目标检测

/examples/yolov5/model ./download_model.sh 下载的是一个ONNX格式的神经网络模型，但发现它无法在瑞芯微系统中直接运行。为了解决这个问题，您计划使用特定

发表于 02-15 13:24

【ELF 2学习板试用】ELF2开发板（飞凌嵌入式）部署yolov5s的自定义模型

=3 data=0x25720530 root@elf2-desktop:~/rknn_yolov5_demo# 上机测试结果：图13 测试

发表于 02-04 18:15

在RK3568教学实验箱上实现基于YOLOV5的算法物体识别案例详解

非常流行的实时目标检测模型，它提供了出色的性能和精度。YOLOv5可以分为三个部分，分别是： 1、主干特征提取网络(Backbone) 2、加强特征提取网络(FPN) 3、分类器与回归器(Yolo

发表于 12-03 14:56

在树莓派上部署YOLOv5进行动物目标检测的完整流程

卓越的性能。本文将详细介绍如何在性能更强的计算机上训练YOLOv5模型，并将训练好的模型部署到树莓派4B上，通过树莓派的摄像头进行实时动物目标检测。一、在电脑上训练YOLOv5

发表于 11-11 10:38 •1788次阅读

RK3588 技术分享 | 在Android系统中使用NPU实现Yolov5分类检测

盘资料中提供了Yolov5分类检测的示例—rknn_yolov5_android_apk_demo（基于瑞芯微官方demo修改） ⑵ 例程测试启动 Android Studio，打开

发表于 10-24 10:13

手册上新 |迅为RK3568开发板NPU例程测试

yolov5目标检测 6.13 yolov5-seg语义分割 6.14 yolov6目标检测 6.15 yolov7目标检测 6.16 yolov

发表于 10-23 14:06

【飞凌嵌入式OK3576-C开发板体验】rknn实现yolo5目标检测

rknn.api import RKNN 模型转换以官方model_zoo中的YOLOv5为例，进行模型的转换及测试准备模型首先我们需要克隆项目：https://github.com

发表于 09-19 02:20

RK3588 技术分享 | 在Android系统中使用NPU实现Yolov5分类检测-迅为电子

RK3588 技术分享 | 在Android系统中使用NPU实现Yolov5分类检测-迅为电子

发表于 08-23 14:58 •947次阅读

RK3588 技术分享 | 在Android系统中使用NPU实现Yolov5分类检测

盘资料中提供了Yolov5分类检测的示例—rknn_yolov5_android_apk_demo（基于瑞芯微官方demo修改） ⑵ 例程测试启动 Android Studio，打开

发表于 08-20 11:13

基于迅为RK3588【RKNPU2项目实战1】：YOLOV5实时目标分类

[/url] 【RKNPU2 人工智能开发】【AI深度学习推理加速器】——RKNPU2 从入门到实践（基于RK3588和RK3568）【RKNPU2项目实战1】：YOLOV5实时目标分类【RKNPU2项目实战2】：SORT

发表于 08-15 10:51

手册上新 |迅为RK3568开发板NPU例程测试

yolov5目标检测 6.13 yolov5-seg语义分割 6.14 yolov6目标检测 6.15 yolov7目标检测 6.16 yolov

发表于 08-12 11:03

YOLOv5的原理、结构、特点和应用

YOLOv5（You Only Look Once version 5）是一种基于深度学习的实时目标检测算法，它属于卷积神经网络（CNN）的范畴。下面我将详细介绍YOLOv5的原理、结构、特点

发表于 07-03 09:23 •7959次阅读

用yolov5的best.pt导出成onnx转化成fp32 bmodel后在Airbox上跑，报维度不匹配怎么处理？

$ python3 yolov5_opencv_3output.py --bmodel ../../best_pt_1684x_int8_sym.bmodel --input ../../21.png

发表于 05-31 08:10

maixcam部署yolov5s 自定义模型

://github.com/ultralytics/yolov5/releases/download/v7.0/yolov5s.pt 训练（博主使用的是学校的集群进行训练） python3 train.py

发表于 04-23 15:43

yolov5转onnx在cubeAI上部署失败的原因？

第一个我是转onnx时想把权重文件变小点就用了半精度 --half，则说17版本不支持半精度后面则是没有缩小的单精度但是显示哪里溢出了···· 也不说是哪里、、。。。到底能不能部署yolov5这种东西啊？？也没看见几个部署在这上面......................

发表于 03-14 06:23

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

旭日X3派AI推理（YOLOv5测试）

X3芯片概述

1.图片分类任务

2.fcos目标检测快速验证

3.改用YOLOv5进行目标检测

4.使用工具链量化模型

评论

【米尔RK3576开发板评测】+项目名称YOLOV5目标检测

【ELF 2学习板试用】ELF2开发板（飞凌嵌入式）部署yolov5s的自定义模型

在RK3568教学实验箱上实现基于YOLOV5的算法物体识别案例详解

在树莓派上部署YOLOv5进行动物目标检测的完整流程

RK3588 技术分享 | 在Android系统中使用NPU实现Yolov5分类检测

手册上新 |迅为RK3568开发板NPU例程测试

【飞凌嵌入式OK3576-C开发板体验】rknn实现yolo5目标检测

RK3588 技术分享 | 在Android系统中使用NPU实现Yolov5分类检测-迅为电子

RK3588 技术分享 | 在Android系统中使用NPU实现Yolov5分类检测

基于迅为RK3588【RKNPU2项目实战1】：YOLOV5实时目标分类

手册上新 |迅为RK3568开发板NPU例程测试

YOLOv5的原理、结构、特点和应用

用yolov5的best.pt导出成onnx转化成fp32 bmodel后在Airbox上跑，报维度不匹配怎么处理？

maixcam部署yolov5s 自定义模型

yolov5转onnx在cubeAI上部署失败的原因？