0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

目标检测的后处理:NMS vs WBF

Dbwd_Imgtec 来源:未知 2023-07-26 10:25 次阅读
作者:Ching (Chingis)编译ronghuaiyang来源:AI公园

导读

对目标检测后处理中的NMS和WBF的解释和对比。目前,计算机视觉在许多地方都有重要的应用,例如自动驾驶汽车、监控系统和图像识别。计算机视觉的主要挑战之一是目标检测,它涉及识别和定位图像和视频中的目标。为了提高目标检测系统的性能,研究人员和从业者开发了各种技术,例如模型集成和测试时增强(TTA)。

模型集成是组合多个模型的预测以提高系统整体性能的过程。这可以通过对多个模型的预测求平均值,或使用更复杂的方法(如加权框融合 (WBF))来组合预测来完成。集成方法可以通过减少过拟合的影响并提高系统的鲁棒性来显著提高目标检测系统的性能。

测试时增强 (TTA) 是另一种用于提高目标检测系统性能的技术。它在测试期间将各种数据增强技术(例如旋转、缩放和翻转)应用于输入图像。这可以通过使系统对输入数据的微小变化更加不变来帮助提高系统的鲁棒性。TTA还可以通过提供额外的数据供检测器学习来帮助提高系统的性能。

在本文中,我们将探索和比较非最大抑制 (NMS) 和加权框融合 (WBF) 以提高目标检测系统的性能。
非最大值抑制

非极大值抑制 (NMS) 是一种后处理技术,用于去除目标检测器生成的重叠框。它常用于计算机视觉中的目标检测任务,例如人脸检测、目标跟踪以及图像和视频中的目标检测。

NMS 背后的基本思想是选择置信度得分最高的框,然后删除与其显著重叠的其他框。重复此过程,直到考虑了所有框。这有助于减少目标检测中的误报数量,因为目标检测器通常会生成对同一目标的多次检测。

计算两个边界框之间重叠的最常见方法是使用交并比 (IoU) 指标。

IoU(A,B) = (A ∩ B) / (A ∪ B)

其中 A 和 B 是边界框的面积,A ∩ B 是它们相交的面积。通常,为 IoU 度量设置一个阈值,任何 IoU 大于该阈值的边界框都被认为是重复检测并被删除。


加权框融合

加权框融合(WBF)是一种提高目标检测系统性能的强大技术。它是一种将多个边界框或感兴趣区域 (ROI) 的结果组合成一个更准确、更稳定的结果的方法。当使用多个模型或算法来检测图像或视频中的目标并且需要组合结果以提高整体性能时,该技术特别有用。

从本质上讲,WBF 是一种通过根据各种标准为每个边界框分配权重来组合多个目标检测器结果的方法。然后使用这些权重将边界框组合成一个更稳健的结果。

WBF算法的工作步骤如下:

  1. 每个模型的每个预测框(或通过 TTA 获得的预测)都会添加到单个列表 B 中,然后按置信度分数 C 的降序排序。
  2. 分别为框组和融合框实例化新的空列表 L 和 F。因此,列表L中的每个元素都是由于重叠而形成的一组框,而F中的每个位置仅包含一个框,即融合框。
  3. 在一个循环中迭代 B 中的预测框,并检查列表 F 中的匹配框(IoU > THR)。
  4. 如果未找到匹配项,则将 B 中的框添加到列表 L 和 F 的末尾作为新条目;继续进行 B 中的下一个框。
  5. 如果找到匹配,则将此框添加到列表L中与F中的匹配框对应的位置处。
  6. 使用框组 L[pos]中的所有内容重新计算 F[pos]中的框坐标和置信度得分。将置信度得分设置为 L[pos]中所有框的平均置信度。融合框的坐标是形成它的框的坐标的加权和,其中权重是对应框的置信度分数。最终 ROI = Σ (权重 i * ROIi) / Σ 权重 i。其中 ROIi 是第 i 个边界框,weighti 是分配给该边界框的权重,并且对正在考虑进行融合的所有边界框进行求和。最终的 ROI 是计算得出的组合边界框。
  7. 最后,重新调整 F 列表中的置信度分数:将其乘以组中的框数(定义为下面的 T),然后除以模型数 N。如果组中的框数量较少,则可能意味着只有少数模型可以预测它。因此,我们需要降低此类情况的置信度分数。
wKgZomToHbyAffQ2AAAVTLBpKgk243.png

WBF 可以成为提高目标检测系统性能的强大工具,并且越来越多地被广泛应用于自动驾驶汽车、监控系统和计算机视觉的许多其他领域。通过集成WBF技术,目标检测系统可以变得更加鲁棒和准确,并且即使在存在噪声和遮挡的情况下也可以表现得更好。


NMS vs WBFwKgZomToHbyADrUgAAC6PcAkzSs236.png加权框融合(WBF)和非极大值抑制(NMS)都是用于提高目标检测系统性能的技术。然而,它们的使用方式不同,并且具有不同的权衡。NMS 是一种后处理技术,用于删除目标检测器生成的重叠边界框。它的工作原理是选择置信度得分最高的边界框,然后删除与其显着重叠的任何其他边界框。重复此过程,直到考虑了所有边界框。NMS 是一种简单、快速且有效的方法,可减少目标检测中的误报数量。

另一方面,WBF 是一种用于组合多个边界框(或感兴趣区域)的技术,以产生更准确和稳定的结果。它通常用于使用多个模型或算法来检测图像或视频中的对象,并且需要组合结果以提高整体性能的情况。WBF 的工作原理是根据检测置信度、与其他边界框的重叠或其他标准等因素为每个边界框分配权重。然后使用这些权重将边界框组合成一个更稳健的结果。


实验评估2个不同模型的集成wKgZomToHbyAYfNSAADgRfdAtv8570.png表 1 显示了两个模型的 MS COCO 验证集的结果。使用四种不同的技术组合预测:NMS、Soft NMS、NMW 和 WBF。我们看到,在不同的设置下,WBF 方法明显优于其他方法,带来了更大的改进。测试时增强集成wKgZomToHbyALNiKAAB8aWbTHI4275.png

在上表中我们看到作者还提供了通过 TTA 组合预测的实验。他们使用在 COCO 数据集上训练的 EfficientNetB7 模型。对于 TTA,他们只采用水平翻转。同样,我们看到 WBF 的性能明显优于 NMS、Soft-NMS 和 NMW 等其他方法。


最后使用加权框融合 (WBF) 的动机是通过将多个边界框或感兴趣区域 (ROI) 的结果组合成一个更准确和稳定的结果来提高目标检测系统的性能。这在使用多个模型或算法来检测图像或视频中的目标并且需要组合结果以提高整体性能的情况下特别有用。使用 WBF 有益的原因有以下几个:
  • 鲁棒性:物体检测器可能会受到杂波、遮挡和背景噪声等因素的影响。WBF可以通过结合多个检测器的结果来帮助提高物体检测系统的鲁棒性,从而可以减少这些因素的影响。
  • 准确性:WBF 可以通过组合同一物体的多次检测来帮助提高物体检测系统的准确性。这在图像或视频中目标部分被遮挡或仅部分可见的情况下特别有用。
  • 稳定性:WBF 可以通过减少误报和漏报的影响来帮助提高目标检测系统的稳定性。这在感兴趣的物体很小或难以检测的情况下特别有用。
  • 灵活性:WBF可以与非极大值抑制(NMS)等其他技术结合使用,以进一步提高目标检测系统的性能。

英文原文:https://medium.com/deem-blogs/object-detection-explained-nms-vs-wbf-4526d58e7e34

END

欢迎加入Imagination GPU人工智能交流2群

wKgZomToHbyAIsRuAABN8aBfIqc747.jpg

入群请加小编微信:eetrend89

(添加请备注公司名和职称)

推荐阅读 对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数字化转型 下载白皮书 | 通过Photon架构创建身临其境的图形体验

Imagination Technologies是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作 场所中使用。获取更多物联网智能穿戴、通信汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech!


原文标题:目标检测的后处理:NMS vs WBF

文章出处:【微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • imagination
    +关注

    关注

    1

    文章

    570

    浏览量

    61301

原文标题:目标检测的后处理:NMS vs WBF

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    YOLOv10自定义目标检测之理论+实践

    概述 YOLOv10 是由清华大学研究人员利用 Ultralytics Python 软件包开发的,它通过改进模型架构并消除非极大值抑制(NMS)提供了一种新颖的实时目标检测方法。这些优化使得模型在
    的头像 发表于 11-16 10:23 280次阅读
    YOLOv10自定义<b class='flag-5'>目标</b><b class='flag-5'>检测</b>之理论+实践

    YOLOv10:引领无NMS实时目标检测的新纪元

    。 YOLO(You Only Look Once)系列一直是实时目标检测的基准,成功平衡了计算成本和检测性能。尽管在架构设计和优化策略方面取得了进展,但对非最大值抑制(NMS
    的头像 发表于 11-13 17:12 458次阅读
    YOLOv10:引领无<b class='flag-5'>NMS</b>实时<b class='flag-5'>目标</b><b class='flag-5'>检测</b>的新纪元

    第2章 ANSYS分析基本过程--第7章 通用后处理

    第2章  ANSYS分析基本过程--第7章 通用后处理
    发表于 08-31 09:31 0次下载

    第8章 时间历程后处理器--第13章 ANSYS新界面Workbench环境

    第8章  时间历程后处理器--第13章  ANSYS新界面Workbench环境
    发表于 08-30 11:21 0次下载

    不同J-Link版本对于i.MXRT1170连接复位后处理行为

    大家好,我是痞子衡,是正经搞技术的痞子。今天痞子衡给大家介绍的是不同J-Link版本对于i.MXRT1170连接复位后处理行为。
    的头像 发表于 08-08 15:29 391次阅读
    不同J-Link版本对于i.MXRT1170连接复位<b class='flag-5'>后处理</b>行为

    图像分割与目标检测的区别是什么

    的区别。 定义 图像分割是将图像划分为若干个区域或对象的过程,这些区域或对象具有相似的属性,如颜色、纹理或形状。图像分割的目的是将图像中的不同对象或区域分离出来,以便进行进一步的分析和处理目标检测则是在图像中
    的头像 发表于 07-17 09:53 1165次阅读

    目标检测与识别技术有哪些

    目标检测与识别技术是计算机视觉领域的重要研究方向,广泛应用于安全监控、自动驾驶、医疗诊断、工业自动化等领域。 目标检测与识别技术的基本概念 目标
    的头像 发表于 07-17 09:40 553次阅读

    目标检测与识别技术的关系是什么

    目标检测与识别技术是计算机视觉领域的两个重要研究方向,它们之间存在着密切的联系和相互依赖的关系。 一、目标检测与识别技术的概念 目标
    的头像 发表于 07-17 09:38 536次阅读

    目标检测识别主要应用于哪些方面

    目标检测识别是计算机视觉领域的一个重要研究方向,它主要关注于从图像或视频中识别和定位目标物体。随着计算机视觉技术的不断发展,目标检测识别已经
    的头像 发表于 07-17 09:34 966次阅读

    慧视小目标识别算法 解决目标检测中的老大难问题

    随着深度学习和人工智能技术的兴起与技术成熟,一大批如FasterR-CNN、RetinaNet、YOLO等可以在工业界使用的目标检测算法已逐步成熟并进入实际应用,大多数场景下的目标检测
    的头像 发表于 07-17 08:29 419次阅读
    慧视小<b class='flag-5'>目标</b>识别算法   解决<b class='flag-5'>目标</b><b class='flag-5'>检测</b>中的老大难问题

    基于深度学习的小目标检测

    在计算机视觉领域,目标检测一直是研究的热点和难点之一。特别是在小目标检测方面,由于小目标在图像中所占比例小、特征不明显,使得
    的头像 发表于 07-04 17:25 796次阅读

    图像检测与识别技术的关系

    检测技术是指利用计算机视觉技术,对图像中的特定目标进行定位和识别的过程。它通常包括图像预处理、特征提取、目标检测
    的头像 发表于 07-03 14:43 581次阅读

    用OpenVINO C# API在intel平台部署YOLOv10目标检测模型

    的模型设计策略,从效率和精度两个角度对YOLOs的各个组成部分进行了全面优化,大大降低了计算开销,增强了性能。在本文中,我们将结合OpenVINO C# API使用最新发布的OpenVINO 2024.1部署YOLOv10目标检测模型。
    的头像 发表于 06-21 09:23 965次阅读
    用OpenVINO C# API在intel平台部署YOLOv10<b class='flag-5'>目标</b><b class='flag-5'>检测</b>模型

    开发者手机 AI - 目标识别 demo

    %。 Init、DeInit 为Native的初始化和去初始化实现,主要对模型进行创建、编译以及销毁。 Process为异步NAPI接口,主要完成目标识别的功能。实现包括前处理、推理和后处理3个部分。前
    发表于 04-11 16:14

    TLE9850x控制器能否通过设置阈值将ADC1后处理通道0用于ADC1-CH13?

    我目前使用的是 TLE9850x 控制器,能否通过设置阈值将 ADC1 后处理通道 0 用于 ADC1-CH13?
    发表于 03-05 08:04