0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解析在目标检测中怎么解决小目标的问题?

新机器视觉 来源:AI公园 作者:Nabil MADALI 2021-04-26 14:13 次阅读

导读

本文介绍了一些小目标物体检测的方法和思路。

深度学习目标检测中,特别是人脸检测中,由于分辨率低、图像模糊、信息少、噪声多,小目标和小人脸的检测一直是一个实用和常见的难点问题。然而,在过去几年的发展中,也出现了一些提高小目标检测性能的解决方案。本文将对这些方法进行分析、整理和总结。

图像金字塔和多尺度滑动窗口检测

一开始,在深学习方法成为流行之前,对于不同尺度的目标,通常是从原始图像开始,使用不同的分辨率构建图像金字塔,然后使用分类器对金字塔的每一层进行滑动窗口的目标检测。

在著名的人脸检测器MTCNN中,使用图像金字塔法检测不同分辨率的人脸目标。然而,这种方法通常是缓慢的,虽然构建图像金字塔可以使用卷积核分离加速或简单粗暴地缩放,但仍需要做多个特征提取,后来有人借其想法想出一个特征金字塔网络FPN,在不同层融合特征,只需要一次正向计算,不需要缩放图片。它也被应用于小目标检测,这将在后面的文章中讨论。

简单,粗暴和可靠的数据增强

通过增加训练集中小目标样本的种类和数量,也可以提高小目标检测的性能。有两种简单而粗糙的方法:

针对COCO数据集中含有小目标的图片数量较少的问题,使用过采样策略:

31941d6e-a648-11eb-aece-12bb97331649.jpg

不同采样比的实验。我们观察到,不管检测小目标的比率是多少,过采样都有帮助。这个比例使我们能够在大小物体之间做出权衡。

针对同一张图片中小目标数量少的问题,使用分割mask切出小目标图像,然后使用复制和粘贴方法(当然,再加一些旋转和缩放)。

通过复制粘贴小目标来实现人工增强的例子。正如我们在这些例子中所观察到的,粘贴在同一幅图像上可以获得正确的小目标的周围环境。

在Anchor策略方法中,如果同一幅图中有更多的小目标,则会匹配更多的正样本。

31b10384-a648-11eb-aece-12bb97331649.jpg

与ground truth物体相匹配的不同尺度anchor示意图,小的目标匹配到更少的anchor。为了克服这一问题,我们提出通过复制粘贴小目标来人工增强图像,使训练过程中有更多的anchor与小目标匹配。

特征融合FPN

不同阶段的特征图对应不同的感受野,其所表达的信息抽象程度也不同。

浅层特征图感受野小,更适合检测小目标,深层特征图较大,更适合检测大目标。因此,有人提出将不同阶段的特征映射整合在一起来提高目标检测性能,称之为特征金字塔网络FPN。

31cc7b5a-a648-11eb-aece-12bb97331649.jpg

(a)利用图像金字塔建立特征金字塔。特征的计算是在每个图像的尺度上独立进行的,这是很缓慢的。(b)最近的检测系统选择只使用单一尺度的特征以更快地检测。另一种选择是重用由ConvNet计算出的金字塔特征层次结构,就好像它是一个特征图金字塔。(d)我们提出的特征金字塔网络(FPN)与(b)和一样快,但更准确。在这个图中,特征图用蓝色轮廓线表示,较粗的轮廓线表示语义上较强的特征。

由于可以通过融合不同分辨率的特征图来提高特征的丰富度和信息含量来检测不同大小的目标,自然会有人进一步猜测,如果只检测高分辨率的特征图(浅层特征)来检测小人脸,使用中分辨率特征图(中间特征)来检测大的脸。

31d8be38-a648-11eb-aece-12bb97331649.jpg

SSH的网络结构

合适的训练方法SNIP, SNIPER, SAN

机器学习中有一点很重要,模型预训练的分布应该尽可能接近测试输入的分布。因此,在大分辨率(如常见的224 x 224)下训练的模型不适合检测小分辨率的图像,然后放大并输入到模型中。

如果输入的是小分辨率的图像,则在小分辨率的图像上训练模型,如果没有,则应该先用大分辨率的图片训练模型,然后再用小分辨率的图片进行微调,最坏的情况是直接使用大分辨率的图像来预测小分辨率的图像(通过上采样放大)。

因此,在实际应用中,对输入图像进行放大并进行高速率的图像预训练,然后对小图像进行微调比针对小目标训练分类器效果更好。

3202a8ce-a648-11eb-aece-12bb97331649.jpg

所有的图都报告了ImageNet分类数据集验证集的准确性。我们对48、64、80等分辨率的图像进行上采样,在图(a)中绘制出预训练的ResNet-101分类器的Top-1精度。图(b、c)分别为原始图像分辨率为48,96像素时不同cnn的结果。

更密集的Anchor采样和匹配策略S3FD, FaceBoxes

如前面的数据增强部分所述,将一个小目标复制到图片中的多个位置,可以增加小目标匹配的anchor数量,增加小目标的训练权重,减少网络对大目标的偏置。同样,在逆向思维中,如果数据集已经确定,我们也可以增加负责小目标的anchor的设置策略,使训练过程中对小目标的学习更加充分。

例如,在FaceBoxes中,其中一个贡献是anchor策略。

320c45dc-a648-11eb-aece-12bb97331649.jpg

Anchor变的密集例子。为了清晰起见,我们只对一个感受野中心(即中央黑色网格)密集化锚点,并只给对角锚点上色。

Anchor密集化策略,使不同类型的anchor在图像上具有相同的密度,显著提高小人脸的召回率。

总结

本文较详细地总结了一般目标检测和特殊人脸检测中常见的小目标检测解决方案。

英文原文:https://medium.datadriveninvestor.com/how-to-deal-with-small-objects-in-object-detection-44d28d136cbc

来源:AI公园

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 噪声
    +关注

    关注

    13

    文章

    1122

    浏览量

    47420
  • 分辨率
    +关注

    关注

    2

    文章

    1063

    浏览量

    41937
  • 人脸检测
    +关注

    关注

    0

    文章

    80

    浏览量

    16463

原文标题:在目标检测中如何解决小目标的问题?

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    挑战的方法。 2 目标检测模型介绍 目标检测的任务,有着许许多多的模型,如 Picodet、
    发表于 12-19 14:33

    树莓派上部署YOLOv5进行动物目标检测的完整流程

    目标检测计算机视觉领域中具有重要意义。YOLOv5(You Only Look One-level)是目标检测算法
    的头像 发表于 11-11 10:38 1025次阅读
    <b class='flag-5'>在</b>树莓派上部署YOLOv5进行动物<b class='flag-5'>目标</b><b class='flag-5'>检测</b>的完整流程

    目标检测中大物体的重要性

    导读实验表明,对大型物体赋予更大的权重可以提高所有尺寸物体的检测分数,从而整体提升目标检测器的性能(COCOval2017数据集上使用InternImage-T模型,小物体
    的头像 发表于 10-09 08:05 476次阅读
    <b class='flag-5'>在</b><b class='flag-5'>目标</b><b class='flag-5'>检测</b>中大物体的重要性

    图像分割与目标检测的区别是什么

    的区别。 定义 图像分割是将图像划分为若干个区域或对象的过程,这些区域或对象具有相似的属性,如颜色、纹理或形状。图像分割的目的是将图像的不同对象或区域分离出来,以便进行进一步的分析和处理。 目标检测则是
    的头像 发表于 07-17 09:53 1337次阅读

    目标检测与图像识别的区别在哪

    检测(Object Detection)是指在图像或视频识别并定位感兴趣的目标,通常包括目标的类别和位置。目标
    的头像 发表于 07-17 09:51 895次阅读

    目标检测与识别技术有哪些

    视频识别并定位感兴趣的目标,通常包括目标的类别和位置信息。目标识别(Object Recognition)是指对检测到的
    的头像 发表于 07-17 09:40 614次阅读

    目标检测与识别技术的关系是什么

    任务是图像或视频快速准确地定位出感兴趣的目标,并给出目标的位置信息。目标检测技术通常包括候选
    的头像 发表于 07-17 09:38 613次阅读

    目标检测识别主要应用于哪些方面

    介绍目标检测识别的应用领域,以及其各个领域的具体应用情况。 安全监控 安全监控是目标检测识别应用最广泛的领域之一。
    的头像 发表于 07-17 09:34 1080次阅读

    慧视小目标识别算法 解决目标检测的老大难问题

    随着深度学习和人工智能技术的兴起与技术成熟,一大批如FasterR-CNN、RetinaNet、YOLO等可以工业界使用的目标检测算法已逐步成熟并进入实际应用,大多数场景下的目标
    的头像 发表于 07-17 08:29 502次阅读
    慧视小<b class='flag-5'>目标</b>识别算法   解决<b class='flag-5'>目标</b><b class='flag-5'>检测</b><b class='flag-5'>中</b>的老大难问题

    基于深度学习的小目标检测

    计算机视觉领域,目标检测一直是研究的热点和难点之一。特别是目标检测方面,由于小
    的头像 发表于 07-04 17:25 890次阅读

    基于“双 碳 ”目标的综合用电服务管理系统介绍

    各类厂矿与企事企业单位,基于双碳目标的综合智慧用电管理系统解决方案。
    发表于 04-08 16:29 1次下载

    深度学习检测目标常用方法

    深度学习的效果在某种意义上是靠大量数据喂出来的,小目标检测的性能同样也可以通过增加训练集中小目标样本的种类和数量来提升。
    发表于 03-18 09:57 727次阅读
    深度学习<b class='flag-5'>检测</b>小<b class='flag-5'>目标</b>常用方法

    百度开源DETRs实时目标检测胜过YOLOs

    这篇论文介绍了一种名为RT-DETR的实时检测Transformer,是第一个实时端到端目标检测器。
    的头像 发表于 03-06 09:24 1582次阅读
    百度开源DETRs<b class='flag-5'>在</b>实时<b class='flag-5'>目标</b><b class='flag-5'>检测</b><b class='flag-5'>中</b>胜过YOLOs

    巍泰技术毫米波雷达如何助力道路车辆预警?静态目标检测是关键

    毫米波雷达可以识别静态目标,但在某些应用场景下,为了防止功能误触,会滤除静止目标的特征。然而,在车辆预警的实际应用,静态目标的检测十分必要
    的头像 发表于 02-27 15:59 951次阅读
    巍泰技术毫米波雷达如何助力道路车辆预警?静态<b class='flag-5'>目标</b><b class='flag-5'>检测</b>是关键

    目标显示雷达工作原理

    目的:抑制由杂波产生的类似目标的回波,而让动目标回波通过后的损失尽量小或没损失。
    发表于 01-24 10:06 662次阅读
    动<b class='flag-5'>目标</b>显示雷达工作原理