简述深度学习的基准目标检测及其衍生算法-电子发烧友网

1 基于深度学习的基准目标检测模型

基于深度学习的目标检测方法根据有无区域提案阶段划分为区域提案检测模型和单阶段检测模型，其最近发展历程在图1中画出。

▲ 图1 基于深度学习的目标检测模型的发展历程

1.1 区域提案目标检测基准模型

区域提案检测模型将目标检测任务分为区域提案生成、特征提取和分类预测三个阶段。在区域提案生成阶段，检测模型利用搜索算法如选择性搜索（Selective Search，SS）、EdgeBoxes、区域提案网络（Region Proposal Network， RPN）等在图像中搜寻可能包含物体的区域。在特征提取阶段，模型利用深度卷积网络提取区域提案中的目标特征。在分类预测阶段，模型从预定义的类别标签对区域提案进行分类和边框信息预测。

2012年，卷积神经网络AlexNet通过强大的分层特征学习能力在ImageNet分类任务中夺魁，其分类结果比传统算法要好得多。之后Girshirk等基于此提出通用的目标检测模型RCNN。

受空间金字塔匹配启发，He等提出空间金字塔池化网络（Spatial Pyramid Pooling Network， SPPNet）解决RCNN模型中固定大小图像输入的问题。尽管模型能解决固定大小图像输入的问题并大幅减少检测时间，但网络输出特征需要磁盘存储且网络不能通过反向传播更新卷积层参数。Fast RCNN，Faster RCNN解决了该问题。

尽管Faster RCNN运用RPN能有效地缩短检测时间，但图像中上百个区域提案仍需输入到区域子网络来分类与坐标回归，这是模型的计算瓶颈。若直接减少区域子网络的深度则会引起基于分类初始模型与检测模型的矛盾，因为分类会增加物体的平移不变性而检测则减少物体的平移不变性。为解决上述问题，代表性的方法有RFCN，Mask RCNN。上述模型的相关信息在表1中列出。

▲ 表1 区域提案目标检测基准模型

1.2 单阶段目标检测基准模型

虽然区域提案检测模型保持着高效的检测效率，但其耗费时间长难以得到实际应用。相较于区域提案检测模型，单阶段检测模型联合区域提案和分类预测，输入整张图像到卷积神经网络中提取特征，最后直接输出目标类别和边框位置信息。这类代表性的方法有：YOLO，YOLOv2，YOLOv3，YOLOv4，SSD，CornerNet等。

针对YOLO模型中目标定位不准确的问题，Liu等人提出更准确的单阶段实时检测模型SSD（Single Shot MultiBox Detector），其结合YOLO的回归思想与Faster RCNN的锚框机制。之后DSSD（DeconvolutionalSingle Shot Detector）用于小目标检测。然而，锚框机制也存在明显的缺陷，如正负样本不平衡、引入过多的超参数而折戟检测速度与性能等。基于此，研究者提出了无锚框单阶段检测模型，上述模型的相关信息在表2中列出。

▲ 表2 单阶段目标检测基准模型

2 基于深度学习的目标检测衍生算法

当前主流的基于深度学习的目标检测方法可分为检测部件、数据增强、优化方法和学习策略四个方面。其中检测部件包含基准模型和基准网络；数据增强包含几何变换、光学变换等；优化方法包含特征图、上下文模型、边框优化、区域提案方法、类别不平衡和训练策略六个方面，学习策略涵盖监督学习、弱监督学习和无监督学习。本节从优化方法和学习策略这两个大的方面归纳总结了深度学习下基准目标检测模型的衍生方法。基于深度学习的目标检测部件及其代表性的检测方法如图2所示。

▲ 图2 基于深度学习的目标检测部件及其代表性的检测方法

2.1 融合特征图的目标检测模型

特征图是图像经过卷积池化层输出的结果，大多数基准检测模型只在顶层特征图做预测，这在很大程度上限制了模型的性能。为了充分提取特征信息，现有检测模型从三个角度融合浅中深层特征，分别是：结合多层特征图单层预测模型（ION、HyperNet）、分层预测模型（MSCNN、SSD、RFBNet、TridentNet）和结合多层特征图多层预测模型（FPN、DSSD、STDN、DetNet、M2Det、FCOS、EfficientDet）。相关模型信息在表4中列出。

▲ 表4 融合特征图的目标检测模型

2.2 结合上下文信息的目标检测模型

在物体遮挡、背景信息杂乱或图像质量不佳的情况下，根据图像的上下文信息能更有效更精确地检测。现有的目标检测模型主要考虑将上下文信息分为全局上下文信息（DeepIDNet、ION、CPF）和局部上下文信息（MR‑CNN、GBDNet、ACCNN、CoupleNet）。相关模型的信息在表5中列出。

▲ 表5 上下文模型和边框优化模型

2.3 优化边框定位的目标检测模型

当前检测模型在小目标检测表现不佳的主要原因是定位错误偏多，包含定位偏差大和重复预测，因此部分研究着眼于优化边框定位来提升检测性能，代表性的模型有MRCNN、Cascade RCNN、Grid RCNN等。此外，一些算法使用后处理步骤来优化预测框位置，如NMS、Soft‑NMS、Softer‑NMS等。

2.4 高效区域提案的目标检测模型

区域提案是图像中可能包含物体的区域，它是两阶段检测模型中性能保障的关键。早期的检测模型DPM使用滑动窗口方法，存在计算复杂度高和定位性能差的问题。RCNN使用SS算法提取候选区域并利用卷积神经网络提取图像特征，其检测效率和性能上均有大幅提高。EdgeBox利用图像中低维线索如颜色、纹理、边缘、梯度等对其分类，表现出良好的检测性能。Kuo等人在EdgeBox基础上提出DeepBox检测模型，运行速度更快且提案窗口召回率更高。Ren等人提出使用RPN生成候选区域的Faster RCNN检测模型，在特征图上以每个像素点为中心生成三个尺度和三个长宽比总共九个锚框。Ghodrati等人提出DeepProposal检测模型，使用多个级联的卷积特征来生成对象提案再构建逆级联选择图像中可能存在的对象位置。

2.5 处理类别不平衡的目标检测模型

类别不平衡的主要矛盾是负样本数远多于正样本数，导致训练的深度模型效率低。传统检测算法常用Bootstrapping方法处理此问题，之后RCNN模型使用困难样本挖掘（Hard ExampleMining，HEM）方法来处理。Shrivastava等人在HEM基础上提出在线困难样本挖掘方法（OnlineHard Example Mining， OHEM），其根据区域提案损失有选择性地反向传播负样本区域更新梯度。最近，Lin等人提出使用Focal Loss的单阶段检测模型RetinaNet，使模型更关注于那些少量的困难样本。表6总结了类别不平衡处理模型和训练策略方法。

▲ 表6 类别不平衡处理模型和训练策略方法

2.6 训练策略

大多数目标检测模型采取小批量样本进行训练，然而小批量样本训练存在梯度不稳定、训练时间长等问题。研究者们提出一些高效的方法解决上述问题，典型的方法有：MegNet，LargeDet，SNIP，SNIPER，DSOD， ScratchDet等。相关训练策略的信息在表6中列出。

2.7 基于弱监督学习的目标检测方法

数据标注的昂贵性和人工标注的主观性已成为一个棘手的问题。基于弱监督学习的目标检测方法主要划分为三类：基于分割的目标检测方法、基于多示例学习的目标检测方法和基于深度学习的目标检测方。这些模型的相关信息在表7中列出。

▲ 表7 基于弱监督学习的通用目标检测方法

2.8 基于无监督的目标检测方法

尽管基于弱监督学习的目标检测方法仅需要图像级别信息即可训练，表现出了良好的性能。然而，在现实应用中图像往往没有标注信息。目前，基于无监督学习的目标检测方法大致可分为两类：基于分割的目标检测方法和基于领域自适应的目标检测方法。模型的相关信息在表8中列出。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

目标检测

目标检测

+关注

关注
0

文章
221

浏览量
15863
深度学习

深度学习

+关注

关注
73

文章
5549

浏览量
122373
卷积神经网络

卷积神经网络

+关注

关注
4

文章
369

浏览量
12148

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

简述深度学习的基准目标检测及其衍生算法

1.1 区域提案目标检测基准模型

1.2 单阶段目标检测基准模型

2.1 融合特征图的目标检测模型

2.2 结合上下文信息的目标检测模型

2.3 优化边框定位的目标检测模型

2.4 高效区域提案的目标检测模型

2.5 处理类别不平衡的目标检测模型

2.6 训练策略

2.7 基于弱监督学习的目标检测方法

2.8 基于无监督的目标检测方法

评论

X-NUCLEO-53L4A2: VL53L4CX飞行时间传感器具测量扩展板

ATA-2022H高压放大器西安安泰电子双通道

按摩仪方案PCBA设计

MK17系列干簧传感器

鸿诚志远RK系列行业主板套件

大大通

83

下载

斯丹麦德电子

28

下载

斯丹麦德电子

51

下载

RA生态工作室

186

下载

合众恒跃

86

下载

低功耗×低抖动×多封装：FCom富士晶振FCO-PJ系列时钟方案解析

高效能电动工具控制方案：基于STM32G473和STDRIVE101的参考设计

适配1.8V/2.5V/3.3V电压的高稳定晶振方案（含MCU推荐）

Nordic nRF52840 | Dialog DA14695 等可穿戴平台超低功耗振荡器芯片应用方案

基于 NXP NCJ29D5D UWB 定位算法方案

搜索历史

简述深度学习的基准目标检测及其衍生算法

1.1 区域提案目标检测基准模型

1.2 单阶段目标检测基准模型

2.1 融合特征图的目标检测模型

2.2 结合上下文信息的目标检测模型

2.3 优化边框定位的目标检测模型

2.4 高效区域提案的目标检测模型

2.5 处理类别不平衡的目标检测模型

2.6 训练策略

2.7 基于弱监督学习的目标检测方法

2.8 基于无监督的目标检测方法

评论

智能家居中的清凉“智”选，310V无刷吊扇驱动方案--其利天下

电源入口处防反接电路-汽车电子硬件电路设计

半导体芯片需要做哪些测试

解决方案 | 芯佰微赋能示波器：高速ADC、USB控制器和RS232芯片——高性能示波器的秘密武器！

硬件设计基础----运算放大器

ElfBoard技术贴|如何调整eMMC存储分区

米尔基于MYD-YG2LX系统启动时间优化应用笔记

运放技术——基本电路分析

飞凌嵌入式携手中移物联，谱写全国产化方案新生态

ATA-2022B高压放大器在螺栓松动检测中的应用

MOS管驱动电路——电机干扰与防护处理

压敏（MOV）在电机上的应用剖析

硬件原理图学习笔记

TurMass™ vs LoRa：无线通讯模块的革命性突破

RZT2H CR52双核BOOT流程和例程代码分析