一文带你了解水下目标检测方法-电子发烧友网

水下目标检测旨在对水下场景中的物体进行定位和识别。这项研究由于在海洋学、水下导航等领域的广泛应用而引起了持续的关注。但是，由于复杂的水下环境和光照条件，这仍然是一项艰巨的任务。因此近年来有多个赛事与水下目标检测相关，如近期正在进行的2021全国水下机器人大赛，接下来我们将介绍在水下目标检测领域的深度学习方法概述。

01 水下目标检测的关键问题

1.1 水下图片模糊

在水下场景中，由于光照影响大大降低了水下图像的质量，从而导致了可见度损失，弱对比度和纹理失真，颜色变化等问题（如下图所示），并且在水下场景中环境复杂，这导致水下目标检测更加困难。

1.2 小目标检测

水下环境中的目标物体通常很小，如：海胆，扇贝，海参等，而当前基于深度学习的目标检测器通常无法有效地检测小物体，或者对小目标物体的检测性能较差。

02 水下目标检测的深度学习方法

缓解水下图片模糊主要是通过对水下图片进行增强，去噪，复原等方法，对于小目标检测的问题可以通过数据扩增和改进网络的方式来缓解，接下来我们将介绍近年来解决水下目标检测问题的深度学习方法。

Underwater object detection using Invert Multi-Class Adaboost with deep learning

论文链接： https://arxiv.org/pdf/2005.11552.pdf

代码链接： https://github.com/LongChenCV/SWIPENet

主要方法：文中提出了一种用于水下目标小样本检测的SWIPENet，网络中提出了一种样本重加权算法IMA（Invert Multi-Class Adaboost），IMA会减少missed objects（丢失对象）的权重，以减少这些“干扰”样本的影响。并且在SWIPENet中引入了具有RELU的空洞卷积层（dilated conv）它们可以在不牺牲特征图分辨率的情况下获得大的接受区域。

IMA算法：首先顺序训练多个基本分类器，并根据其错误率Em分配权重值α。然后，将由前面的分类器分类错误的样本分配较高的权重，从而使后面的分类器专注于学习这些样本。最后，将所有弱基础分类器组合在一起，形成具有相应权重的整体分类器。IMA还训练了M次SWIPENet，然后将它们整合为一个统一模型。不同的是，在每次训练迭代中，IMA都会减少丢失对象的权重，以减少这些“干扰”样本的影响。

实验结果：达到URPC 2017的冠军结果，45.0map，冠军为45.1map。

SWIPENet的网络结构图：

RoIMix： Proposal-Fusion among Multiple Images for Underwater Object Detection

论文链接： https://arxiv.org/abs/1911.03029

主要方法：URPC 2019水下目标检测竞赛冠军方案：多图像融合增强，针对水下场景重叠和遮挡（水下生物喜欢聚在一起）、模糊（水中沉淀物导致）的问题，提出一种基于候选框融合的图像增强方法，以生成模拟重叠、遮挡、模糊的训练样本，从而提高模型的mAP和鲁棒性。RoIMix算法使用RPN产生ROI，并以随机的比例混合它们。该比例是根据Beta分布产生的，然后，使用混合样本来训练模型。

下图中：

即为用RoIMix图像增强方法生成的模拟遮挡+模糊的训练样本

RoIMix的网络结构图：

实验结果：达到URPC 2019的冠军方案，ROIMIX和BaseLine之间的最大性能差异为9.05%个mAP值。

An Underwater Image Enhancement Benchmark Dataset and Beyond

论文链接： https://arxiv.org/abs/1901.05495v1

代码链接： https://github.com/Li-Chongyi/Water-Net_Code

主要方法：文中提出了一个新的具有950张水下图片的数据集UIEBD，包含各个水下场景，以及水下各种特征退化（光线不足、雾）的情况，用数据集UIEBD对12种现阶段主流的水下图片增强算法进行评测和验证。并且提出基于fusion的水下图片增强模型DuwieNet。

12种水下数据扩增方法比较：

DUIENet：基于所构建的UIEBD数据集，作者提出了一种用于水下图像增强的CNN模型，称为DuwieNet。DuwieNet是—种门控融合网络，它将输入与预测的置信度图融合以获得增强的结果。首先通过FTUs将输入转换为精确的输入，然后预测置信度图。最后，将改进后的输入与相应的置信度图进行融合，得到增强后的结果。其结构图如下所示：

实验结果：

03 水下目标检测比赛的开源方案

在去年的2020年全国水下机器人（湛江）大赛水下目标检测比赛众多，部分选手公开了他们的参赛方案，他们在比赛中的经验这对我们研究水下目标检测具有很大的参考价值，下面我根据使用的检测框架进行分类，简单介绍其中的几个开源方案

3.1 mmdection

和鲸社区Kesci 水下目标检测算法赛（光学图像赛项）三等奖单模方案

代码链接：https://github.com/milleniums/underwater-object-detection-mmdetection

方法简述：

使用两阶段检测框架，保证精度要求；

使用FPN，增强小目标的检测效果；

使用Mixup、旋转等无损的数据增强技术，减轻网络过拟合，并提升模型泛化能力；

使用多尺度训练与预测，适应图片分辨率差异，可以让参与训练的目标大小分布更加均衡，使模型对目标大小具有一定的鲁棒性；

参考ResNet论文，使用Global Context ROI为每个候选框添加上下文信息，充分利用数据分布特点，提升了检测精度。

消融实验：

和鲸社区Kesci 水下目标检测算法赛（光学图像赛项）30（A榜） / 31（B榜）

代码链接： https://github.com/Wakinguup/Underwater_detection

方法简述：

1、数据增强：

采用Mixup、实例平衡增强、模糊（Median Blur和 Motion Blur）、Retinex、泊松融合、标签平滑。

2、模型框架：mmdetection代码库中的Cascade R-CNN模型，其中backbone是ResNeXt101-64x4d （64是基数Cardinality，X101的一个block的group数量。而4d是指bottleneck的宽度）。模型同时也搭配了FPN［3］，增强模型对小目标的检测能力。

3.2 EfficientDet

EfficientDet训练水下目标检测数据集

代码链接： https://github.com/DataXujing/EfficientDet_pytorch

方法简述：

这个使用EfficientDet进行水下目标检测，仅是baseline无任何tricks，Step by Step演示如何训练最近开源的相对SOTA的Pytorch版的EfficientDet的训练，评估，推断的过程。像paper中提到的一样，我们并没有使用任何数据增强或模型融合等后处理的trick来提高模型的精度，如果你想增加数据增强的策略可以在efficientdet/dataset.py中实现；

3.3 YOLOV5

我们团队这次也参加了2021年全国水下机器人（湛江）大赛，为大家开源了YOLOV5检测的baseline

代码：https://github.com/wangdongdut/Underwater-Object-Detection

04 总结

水下目标检测目前任然还是一个具有挑战的领域，相比于传统图像处理方法分多个步骤和环节处理检测任务，基于深度学习的方法将其统一为端到端的特征提取和分类。虽然水下目标检测技术已经不断地从学术研究走向成熟的工业应用，但是依然有一些需要解决的问题。

编辑：jq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
211

文章
28552

浏览量
207634
数据

数据

+关注

关注
8

文章
7101

浏览量
89262
目标检测

目标检测

+关注

关注
0

文章
209

浏览量
15638

原文标题：一文梳理水下目标检测方法

文章出处：【微信号：cas-ciomp，微信公众号：中科院长春光机所】欢迎添加关注！文章转载请注明出处。

视频目标跟踪从0到1，概念与方法

导读从目标跟踪的应用场景，底层模型，组件，类型和具体算法几个方面对目标跟踪做了全方面的介绍，非常好的入门文章。在今天的文章中，我们将深入研究视频目标跟踪。我们从基础开始，了解

发表于 11-20 01:06 •403次阅读

视频<b class='flag-5'>目标</b>跟踪从0到1，概念与<b class='flag-5'>方法</b>

智慧公交是什么？一文带你详解智慧公交的解决方案！

发表于 11-05 12:26 •333次阅读

智慧公交是什么？<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>带你</b>详解智慧公交的解决方案！

图像分割与目标检测的区别是什么

图像分割与目标检测是计算机视觉领域的两个重要任务，它们在许多应用场景中都发挥着关键作用。然而，尽管它们在某些方面有相似之处，但它们的目标、方法和应用场景有很大的不同。本文将介绍图像分割

发表于 07-17 09:53 •1426次阅读

目标检测与识别技术有哪些

目标检测与识别技术是计算机视觉领域的重要研究方向，广泛应用于安全监控、自动驾驶、医疗诊断、工业自动化等领域。目标检测与识别技术的基本概念目标

发表于 07-17 09:40 •657次阅读

目标检测与识别技术的关系是什么

目标检测与识别技术是计算机视觉领域的两个重要研究方向，它们之间存在着密切的联系和相互依赖的关系。一、目标检测与识别技术的概念

发表于 07-17 09:38 •723次阅读

慧视小目标识别算法解决目标检测中的老大难问题

随着深度学习和人工智能技术的兴起与技术成熟，一大批如FasterR-CNN、RetinaNet、YOLO等可以在工业界使用的目标检测算法已逐步成熟并进入实际应用，大多数场景下的目标

发表于 07-17 08:29 •534次阅读

基于深度学习的小目标检测

在计算机视觉领域，目标检测一直是研究的热点和难点之一。特别是在小目标检测方面，由于小

发表于 07-04 17:25 •982次阅读

深入了解目标检测深度学习算法的技术细节

本文将讨论目标检测的基本方法(穷尽搜索、R-CNN、FastR-CNN和FasterR-CNN)，并尝试理解每个模型的技术细节。为了让经验水平各不相同的读者都能够理解，文章不会使用任何公式来进行讲解

发表于 04-30 08:27 •364次阅读

5.8G WiFi和2.4G WiFi如何选择？一文带你深度了解

在无线网络的世界中，5.8GWiFi和2.4GWiFi作为两种常见的无线通信技术，各自具有独特的特点和优势。本文将带你深入了解这两种技术的区别、优势以及适用场景，帮助你更好地选择适合自己的无线通信

发表于 04-18 09:49 •3479次阅读

一文带你了解NVIDIA Jetson

计算机发展成为今天的机器有着悠久的历史，今天看到的许多计算机都遵循类似的设计结构，至少包含CPU、GPU、内存和存储。迄今为止，我们对计算机设计的了解大部分都是基于这些使计算机正常运行的关键组件

发表于 04-09 11:49 •675次阅读

一文带你了解PWM原理、频率与占空比

什么是PWM脉冲宽度调制(PWM)，是英文“Pulse Width Modulation”的缩写，简称脉宽调制，是利用微处理器的数字输出来对模拟电路进行控制的一种非常有效的技术，广泛应用在从测量

发表于 03-27 14:12

一文读懂爆破压力检测仪的使用方法，测试原理和压力单位换算关系

检测仪的使用方法、测试原理以及压力单位换算关系，帮助您更好地了解和应用耐压爆破试验机。一、爆破压力检测仪的使用

发表于 03-21 08:28 •798次阅读

深度学习检测小目标常用方法

深度学习的效果在某种意义上是靠大量数据喂出来的，小目标检测的性能同样也可以通过增加训练集中小目标样本的种类和数量来提升。

发表于 03-18 09:57 •759次阅读

一文带你了解毫米波雷达

一、毫米波雷达简介（一）定义雷达是英文 Radar 的音译，源于 Radio Detection and Ranging 的缩写，原意是“无线电探测和测距”，即用无线电方法发现目标

发表于 03-06 16:50 •1.1w次阅读

pcb应变测试有多重要？一文了解！

pcb应变测试有多重要？一文了解！

发表于 02-24 16:26 •1144次阅读