0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

目标检测和模型介绍

新机器视觉 来源:Coggle数据科学 作者:Coggle数据科学 2022-07-21 15:50 次阅读

目标检测介绍

目标检测是计算机视觉领域中最基础且最具挑战性的任务之一,其包含物体分类和定位。它为实例分割、图像捕获、视频跟踪等任务提供了强有力的特 征分类基础。

传统的目标检测方法包括预处理、区域提案、特征提取、特征选择、特征分类和后处理六个阶段,大多数检测模型关注于物体特征的提取和区域分类算法的选择。

Deformable Part⁃based Model(DPM)算法三次在PASCAL VOC目标检测竞赛上获得冠军,是传统目标检测方法的巅峰之作. 然而在2008年至2012年期间,目标检测模型在PASCAL VOC数据集上的检测准确率逐渐达到瓶颈. 传统方法的弊端也展现出来,主要包括:

算法在区域提案生成阶段产生大量冗余的候选框且正负样本失衡;

特征提取器如HOG、SIFT等未能充分捕捉图像的高级语义特征和上下文内容;

传统检测算法分阶段进行,整体缺乏一种全局优化策略

目标检测数据集

目前主流的通用目标检测数据集有PASCAL VOC、ImageNet、MS COCO、Open Images和Objects365。

目标检测评价指标

当前用于评估检测模型的性能指标主要有帧率每秒(Frames Per Second,FPS)、准确率(accuracy)、精确率(precision)、召回率(recall)、平均精度(Average Precision,AP)、平均 精度均值(mean Average Precision,mAP)等。

FPS即每秒识别图像的数量,用于评估目标检测模型的检测速度;

accuracy是正确预测类别的样本数占样本总数的比例;

precision是预测正确的正样本数占所有预测为正样本个数的比例;

recall是预测正确的正样本数占所有真实值为正样本个数的比例;

PR曲线是对应precision和recall构成的曲线;

AP是对不同召回率点上的精确率进行平均,在PR曲线图上表现为 PR 曲线下的面积;

mAP是所有类别AP的平均;

目标检测模型

基于深度学习的目标检测方法根据有无区域提案阶段划分为双阶段模型和单阶段检测模型。

a4770d36-07e1-11ed-ba43-dac502259ad0.png

双阶段模型

区域检测模型将目标检测任务分为区域提案生成、特征提取和分类预测三个阶段。在区域提案生成阶段,检测模型利用搜索算法如选择性搜索(SelectiveSearch,SS)、EdgeBoxes、区 域 提 案 网 络(Region Proposal Network,RPN) 等在图像中搜寻可能包含物体的区域。在特征提取阶段,模型利用深度卷积网络提取区域提案中的目标特征。在分类预测阶段,模型从预定义的类别标签对区域提案进行分类和边框信息预测。

单阶段模型

单阶段检测模型联合区域提案和分类预测,输入整张图像到卷积神经网络中提取特征,最后直接输出目标类别和边框位置信息。这类代表性的方法有:YOLO、SSD和CenterNet等。

目标检测研究方向

目标检测方法可分为检测部件、数据增强、优化方法和学习策略四个方面 。其中检测部件包含基准模型和基准网络;数据增强包含几何变换、光学变换等;优化方法包含特征图、上下文模型、边框优化、区域提案方法、类别不平衡和训练策略六个方面,学习策略涵盖监督学习、弱监督学习和无监督学习。

a496b686-07e1-11ed-ba43-dac502259ad0.png

特征图融合

特征图是图像经过卷积池化层输出的结果,大多数基准检测模型只在顶层特征图做预测,这在很大程度上限制了模型的性能。

多层特征图单层预测模型

分层预测模型

结合多层特征图多层预测模型

上下文信息融合

在物体遮挡、背景信息杂乱或图像质量不佳的情况下,根据图像的上下文信息能更有效更精确地检测。

全局上下文信息

局部上下文信息

边框优化

当前检测模型在小目标检测表现不佳的主要原因是定位错误偏多,包含定位偏差大和重复预测。

优化边框定位

NMS优化

类别不均衡优化

类别不平衡的主要矛盾是负样本数远多于正样本数,导致训练的深度模型效率低。

Online Hard Example Mining,OHEM

Focal Loss损失函数

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4586

    浏览量

    92465
  • 目标检测
    +关注

    关注

    0

    文章

    200

    浏览量

    15578
  • 数据集
    +关注

    关注

    4

    文章

    1200

    浏览量

    24615

原文标题:小白学CV:目标检测任务和模型介绍

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    目标检测中大物体的重要性

    导读实验表明,对大型物体赋予更大的权重可以提高所有尺寸物体的检测分数,从而整体提升目标检测器的性能(在COCOval2017数据集上使用InternImage-T模型,小物体
    的头像 发表于 10-09 08:05 383次阅读
    在<b class='flag-5'>目标</b><b class='flag-5'>检测</b>中大物体的重要性

    图像分割与目标检测的区别是什么

    图像分割与目标检测是计算机视觉领域的两个重要任务,它们在许多应用场景中都发挥着关键作用。然而,尽管它们在某些方面有相似之处,但它们的目标、方法和应用场景有很大的不同。本文将介绍图像分割
    的头像 发表于 07-17 09:53 976次阅读

    目标检测与识别技术有哪些

    目标检测与识别技术是计算机视觉领域的重要研究方向,广泛应用于安全监控、自动驾驶、医疗诊断、工业自动化等领域。 目标检测与识别技术的基本概念 目标
    的头像 发表于 07-17 09:40 499次阅读

    目标检测与识别技术的关系是什么

    目标检测与识别技术是计算机视觉领域的两个重要研究方向,它们之间存在着密切的联系和相互依赖的关系。 一、目标检测与识别技术的概念 目标
    的头像 发表于 07-17 09:38 445次阅读

    目标检测识别主要应用于哪些方面

    介绍目标检测识别的应用领域,以及其在各个领域的具体应用情况。 安全监控 安全监控是目标检测识别应用最广泛的领域之一。在安全监控系统中,
    的头像 发表于 07-17 09:34 844次阅读

    慧视小目标识别算法 解决目标检测中的老大难问题

    随着深度学习和人工智能技术的兴起与技术成熟,一大批如FasterR-CNN、RetinaNet、YOLO等可以在工业界使用的目标检测算法已逐步成熟并进入实际应用,大多数场景下的目标检测
    的头像 发表于 07-17 08:29 353次阅读
    慧视小<b class='flag-5'>目标</b>识别算法   解决<b class='flag-5'>目标</b><b class='flag-5'>检测</b>中的老大难问题

    经典卷积网络模型介绍

    经典卷积网络模型在深度学习领域,尤其是在计算机视觉任务中,扮演着举足轻重的角色。这些模型通过不断演进和创新,推动了图像处理、目标检测、图像生成、语义分割等多个领域的发展。以下将详细探讨
    的头像 发表于 07-11 11:45 410次阅读

    基于深度学习的小目标检测

    在计算机视觉领域,目标检测一直是研究的热点和难点之一。特别是在小目标检测方面,由于小目标在图像中所占比例小、特征不明显,使得
    的头像 发表于 07-04 17:25 694次阅读

    人脸检测模型的精确度怎么算

    人脸检测模型的精确度评估是一个复杂的过程,涉及到多个方面的因素。本文将从以下几个方面进行介绍:人脸检测模型的基本概念、评估指标、评估方法、影
    的头像 发表于 07-04 09:14 407次阅读

    用OpenVINO C# API在intel平台部署YOLOv10目标检测模型

    模型设计策略,从效率和精度两个角度对YOLOs的各个组成部分进行了全面优化,大大降低了计算开销,增强了性能。在本文中,我们将结合OpenVINO C# API使用最新发布的OpenVINO 2024.1部署YOLOv10目标检测
    的头像 发表于 06-21 09:23 899次阅读
    用OpenVINO C# API在intel平台部署YOLOv10<b class='flag-5'>目标</b><b class='flag-5'>检测</b><b class='flag-5'>模型</b>

    深入了解目标检测深度学习算法的技术细节

    本文将讨论目标检测的基本方法(穷尽搜索、R-CNN、FastR-CNN和FasterR-CNN),并尝试理解每个模型的技术细节。为了让经验水平各不相同的读者都能够理解,文章不会使用任何公式来进行讲解
    的头像 发表于 04-30 08:27 293次阅读
    深入了解<b class='flag-5'>目标</b><b class='flag-5'>检测</b>深度学习算法的技术细节

    OpenVINO™ C# API部署YOLOv9目标检测和实例分割模型

    YOLOv9模型是YOLO系列实时目标检测算法中的最新版本,代表着该系列在准确性、速度和效率方面的又一次重大飞跃。
    的头像 发表于 04-03 17:35 693次阅读
    OpenVINO™ C# API部署YOLOv9<b class='flag-5'>目标</b><b class='flag-5'>检测</b>和实例分割<b class='flag-5'>模型</b>

    百度开源DETRs在实时目标检测中胜过YOLOs

    这篇论文介绍了一种名为RT-DETR的实时检测Transformer,是第一个实时端到端目标检测器。
    的头像 发表于 03-06 09:24 1337次阅读
    百度开源DETRs在实时<b class='flag-5'>目标</b><b class='flag-5'>检测</b>中胜过YOLOs

    【飞腾派4G版免费试用】第三章:抓取图像,手动标注并完成自定义目标检测模型训练和测试

    抓取图像,手动标注并完成自定义目标检测模型训练和测试 在第二章中,我介绍模型训练的一般过程,其中关键的过程是带有标注信息的数据集获取。训练
    发表于 12-16 10:05

    【飞腾派4G版免费试用】 第二章:在PC端使用 TensorFlow2 训练目标检测模型

    本章记录了如何使用TensorFlow2 进行目标检测模型训练的过程。
    的头像 发表于 12-15 06:40 2410次阅读
    【飞腾派4G版免费试用】 第二章:在PC端使用 TensorFlow2 训练<b class='flag-5'>目标</b><b class='flag-5'>检测</b><b class='flag-5'>模型</b>