0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RPN:Region Proposal Networks (区域候选网络)

jf_96884364 来源:jf_96884364 作者:jf_96884364 2023-01-11 16:55 次阅读

区域建议网络(RPN)首先在faster rcnn中提出。

得到用来预测的feature map

图片在输入网络后,依次经过一系列卷积+ReLU得到的51×39×256维feature map,准备后续用来选取proposal。

生成Anchors

anchor是固定尺寸的bbox。具体做法是:把feature map每个点映射回原图的感受野的中心点当成一个基准点,然后围绕这个基准点选取k个不同的尺寸和比例的anchor。对于W×H大小的卷积feature map(通常为2400),总共有W×H×k个锚点。默认使用3个尺度和3个纵横比,在每个滑动位置上产生k=9个anchor。在feature map上的每个特征点预测多个region proposals。例如对于像素点个数为 51×39 的一幅feature map上就会产生 51×39×9 个候选框。虽然anchors是基于卷积特征图定义的,但最终的 anchors是相对于原始图片的。

图1 九个候选框(anchor)示意图

针对该像素点的每个候选框需要判断其是不是目标区域,如果是目标区域,其边框位置如何确定,具体过程如图2所示,在RPN头部 ,通过以下结构生成 k个anchor。

图 2 RPN 过程示意图

如图2所示,针对特征图中的某一个位置的像素点,对应会有9个候选框。因为输入RPN中有256个通道的特征图,所以要同时对每个通道该位置的像素点都使用不同的3×3的滑动窗口进行卷积,最后将所有通道得到的该位置像素点的卷积值都加起来,得到一个新的特征值,最终使用256组这样的3×3的卷积核,就会得到一个新的256维的向量,这个256维的向量就是用来预测该位置的像素点的,该像素点对应的9个候选框共享这256维向量。

256维向量后面对应两条分支,一条目标和背景的二分类(classification),通过1×1×256×18的卷积核得到 2k 个分数,k等于候选框的个数9,表示这9个anchor是背景的score和anchor是目标的score。如果候选框是目标区域,就去判断该目标区域的候选框位置在哪,这个时候另一条分支就过1×1×256×36的卷积核得到4k个坐标,每个框包含4个坐标(x,y,w,h),就是9个候选区域对应的框应该偏移的具体位置Δxcenter,Δycenter,Δwidth,Δheight。如果候选框不是目标区域,就直接将该候选框去除掉,不再进行后续位置信息的判断操作。

分类分支

考察训练集中的每张图像(含有人工标定的gt box) 的所有anchor划分正负样本:

(1)对每个标定的gt box区域,与其重叠比例最大的anchor记为正样本,保证每个gt至少对应一个正样本anchor

(2)对(1)中剩余的anchor,如果其与某个标定区域重叠比例大于0.7,记为正样本(每个gt可能会对应多个正样本anchor。但每个正样本anchor只可能对应一个gt;如果其与任意一个标定的重叠比例都小于0.3,记为负样本。

回归分支

x,y,w,h分别表示box的中心坐标和宽高,x, x_a ,x分别表示predicted box, anchor box, and ground truth box (y,w,h同理)t_i表示predict box相对于anchor box的偏移,t_i表示ground true box相对于anchor box的偏移,学习目标就是让前者接近后者的值。

在 RPN中部,分类分支(cls)和边框回归分支(bbox reg)分别对这堆anchor进行各种计算。在RPN末端,通过对两个分支的结果进行汇总,来实现对anchor的初步筛除(先剔除越界的anchor,再根据cls结果通过非极大值抑制(NMS)算法去重)和初步偏移(根据bbox reg结果),此时输出的都bbox改头换面叫 Proposal 了

偏移公式如下。An就是anchor的框,pro就是最终得出回归后的边界框,到这里我们的proposals就选好了:

非极大值抑制(Non-maximum suppression)

由于anchor一般是有重叠的overlap,因此,相同object的proposals也存在重叠。为了解决重叠proposal问题,采用NMS算法处理:两个proposal间IoU大于预设阈值,则丢弃score较低的proposal。

IoU阈值的预设需要谨慎处理,如果IoU值太小,可能丢失objects的一些 proposals;如果IoU值过大,可能会导致objects出现很多proposals。IoU典型值为0.6。

Proposal选择

NMS处理后,根据sore对top N个proposals排序。在Faster R-CNN论文中 N=2000,其值也可以小一点,如50,仍然能得到好的结果。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像处理
    +关注

    关注

    27

    文章

    1295

    浏览量

    56809
  • 网络
    +关注

    关注

    14

    文章

    7583

    浏览量

    88962
  • MAP
    MAP
    +关注

    关注

    0

    文章

    49

    浏览量

    15151
收藏 人收藏

    评论

    相关推荐

    AD 如何挖空Solid Region

    我用的AD17,用place-solid Region花了一大块铜皮连接电源网络,直接覆盖了几个电容的焊盘,现在想把这些电容的焊盘做成热焊盘的样子,要不然焊接的时候散热太快,但是没有办法用keep out和pour cutout来做挖空
    发表于 07-24 17:33

    OMAPL138的EDMA3中Global region和Shadow region的区别?

    通道了,我怕DSP端使用后对ARM端有干扰,影响系统的稳定性和健壮性。其实对这部分内容的理解我始终有点困惑,Global region区域的东西是不是对ARM和DSP都是可见的?Shadow
    发表于 06-21 10:08

    请问C6678的EDMA3中Global region和Shadow region有什么区别?

    各位好!EDMA3 userguide中提到EDMA3通道控制器被分为global region和shadow region两种区域,二者都是用来限定特定programmer对该区域
    发表于 08-07 07:28

    请问RPN和RPIn pin有什么区别?

    看一下dsPIC33EP512MC806(64-TQFP)引脚图,一些可重新映射的引脚称为RPn(示例:RP99/RF3),而另一些称为RPIn(示例:RPI60/RC12)。RPN和RPIn
    发表于 06-25 06:07

    什么是Active Networks

    什么是Active Networks  英文缩写: Active Networks 中文译名: 主动网络 分  类: 网
    发表于 02-22 09:50 960次阅读

    什么是个人区域网(PAN)

    什么是个人区域网(PAN) 个人区域网络是利用短距离、低功率无线传输技术,配合Ad Hoc网路架构(Ad Hoc networks) 连接居家环境之资讯家电、办公室个人桌上型或手提电
    发表于 03-22 10:22 1.3w次阅读

    无线个人区域网(WPAN)是什么意思

    无线个人区域网(WPAN)是什么意思 个人区域网络是利用短距离、低功率无线传输技术,配合Ad Hoc网路架构(Ad Hoc networks) 连接居家环境之
    发表于 03-22 10:24 7120次阅读

    深度卷积神经网络在目标检测中的进展

    , HyperNet, SDP-CRC, YOLO,G-CNN, SSD等越来越快速和准确的目标检测方法。基于Region Proposal的方法该类方法的基本思想是:先得到候选区域再对候选区
    发表于 11-16 01:41 5223次阅读
    深度卷积神经<b class='flag-5'>网络</b>在目标检测中的进展

    引入Mask R-CNN思想通过语义分割进行任意形状文本检测与识别

    网络架构由四部分组成,骨干网feature pyramid network (FPN) ,文本候选区域生成网络region proposal
    的头像 发表于 08-07 14:24 1.4w次阅读

    引入锚框掩码网络机制的孪生RPN模型

    针对孪生区域候选网络RPN)易受干扰且目标丢失后无法跟踪的问题,引人锚框掩码网络机制,设计种新型孪生R
    发表于 06-08 14:58 18次下载

    深度学习技术应用于目标视觉检测时存在的困难和挑战

    目标视觉检测的根本问题是估计特定类型目标出现在图像中的哪些位置.如图 1所示, 目标视觉检测技术在流程上大致分为三个步骤:区域建议(Region proposal)、特征表示(Feature representation)和
    发表于 12-21 11:54 2549次阅读

    SiamFC:用于目标跟踪的全卷积孪生网络 fully-convolutional siamese networks for object tracking

    原文链接 SiamFC网络 图中z代表的是模板图像,算法中使用的是第一帧的ground truth;x代表的是search region,代表在后面的待跟踪帧中的候选框搜索区域;ϕ代表
    的头像 发表于 01-11 17:35 1509次阅读
    SiamFC:用于目标跟踪的全卷积孪生<b class='flag-5'>网络</b> fully-convolutional siamese <b class='flag-5'>networks</b> for object tracking

    SiamRPN:High Performance Visual Tracking with Siamese Region Proposal Network 孪生网络

    Siamese-RPN,它能够利用大尺度的图像对离线端到端训练。具体来讲,这个结构包含用于特征提取的 孪生子网络 (Siamese subnetwork)和 候选区域生成网络
    的头像 发表于 01-11 17:41 1131次阅读
    SiamRPN:High Performance Visual Tracking with Siamese <b class='flag-5'>Region</b> <b class='flag-5'>Proposal</b> Network 孪生<b class='flag-5'>网络</b>

    GA-RPNRegion Proposal by Guided Anchoring 引导锚点的建议区域网络

    Detection Toolbox and Benchmark 1.RPN RPNRegion Proposal Network,是用RON来选择感兴趣
    的头像 发表于 01-12 09:32 746次阅读
    GA-<b class='flag-5'>RPN</b>:<b class='flag-5'>Region</b> <b class='flag-5'>Proposal</b> by Guided Anchoring 引导锚点的建议<b class='flag-5'>区域</b><b class='flag-5'>网络</b>

    Palo Alto Networks与IBM携手,深化网络安全合作

    网络安全领域的两大巨头Palo Alto Networks和IBM近日宣布建立全面合作伙伴关系,共同推动网络安全领域的创新发展。根据协议,Palo Alto Networks将收购IB
    的头像 发表于 05-22 09:40 615次阅读