0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一篇关于CVPR‘21使用RL做点云图像配准

新机器视觉 来源:强化学习技术前沿 作者:东林钟声 2021-07-02 08:57 次阅读

深度强化学习(Deep RL)可以通过序列决策式的方式,在很多方面得到应用。这里我们主要介绍一篇CVPR‘21使用RL做点云图像配准的文章:ReAgent: Point Cloud Registration using Imitation and Reinforcement Learninghttps://arxiv.org/abs/2103.15231

总体上而言,ReAgent是通过训练了一个Policy网络,状态是Source点云和Target点云,输出一系列动作(旋转、平移Source点云),使得Source点云最终和Target点云在相同的地方重合。那么我们现在深入其中的细节,其实针对RL的应用文章,最需要关注的点是以下4个方面:

状态(State)设计

动作(Action)设计

奖励(Reward)设计

算法实现

一般来说RL的应用文章在算法上无非使用的是较为广泛使用的算法模型,如DQN、PPO、SAC等。

State

这里的State是将Source和Targe点云通过一个PointNet类似的结构,从高维点云信息Embedding到一个特征空间后,两者Concatenate得到State的表征信息。这里从上图中可以比较好的理解。

Action

这里Action的选择就比较直观,我们需要通过一些操作来旋转、平移Source点云。那么Action就直接设置为旋转、平移相关的动作。这篇文章在实现上,使用离散的动作集,比如x方向的平移为[0.0033,0.01,0.03,0.09,0.27],当然是有正有负。

Reward

Reward的设计就更为直观,就是在执行动作后,看是否Source和Target之间更加接近了。这里使用的是Chamfer Distance(CD)来衡量,下面给出Reward的设计:

4982f126-dacc-11eb-9e57-12bb97331649.png

这里的Reward也很直观,就是加入执行动作之后,是否变得更好?如果变好了就给一个正的奖励,如果变差了就给一个负的奖励。

算法实现

文章采用了PPO。那么ReAgent的总体框架就如下图:

49a7c88e-dacc-11eb-9e57-12bb97331649.png

如果理解了这个问题中的State、Action的设计,还是相当直观的框架。同时笔者也跑通了ReAgent的代码,实际看下其效果如何,主要是观察其序列动作过程

可以看到ReAgent的动作还是相当“丝滑“”且准确的。也希望更多的读者能够探索RL的各种应用,做到像人一样“丝滑”~

—版权声明—

来源:强化学习技术前沿

仅用于学术分享,版权属于原作者。

若有侵权,请联系微信号: 删除或修改!

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 代码
    +关注

    关注

    30

    文章

    4744

    浏览量

    68344
  • 深度强化学习

    关注

    0

    文章

    14

    浏览量

    2295

原文标题:深度强化学习点云配准——ReAgent技术详解

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    使用语义线索增强局部特征匹配

    视觉匹配是关键计算机视觉任务中的关键步骤,包括摄像机定位、图像和运动结构。目前最有效的匹配关键的技术包括使用经过学习的稀疏或密集匹配器,这需要成对的
    的头像 发表于 10-28 09:57 121次阅读
    使用语义线索增强局部特征匹配

    为什么在水文计算中广泛采用线法

    在水文计算中广泛采用线法(或称适线法),主要基于以下几个方面的原因: 、理论依据坚实 线法以经验频率据为基础,通过求解与经验据拟合
    的头像 发表于 09-19 16:10 285次阅读

    Labview实现自定义四维云图(三维曲面图像)可视化显示

    Labview自带有三维曲面图形绘制函数,并可在曲面表面完成云图可视化显示,但是其颜色范围由矩阵Z的最大、最小值自动配置,无法进行用户自定义灵活配置,因此本文在Labview自带的三维曲面图形绘制
    发表于 07-16 10:52 52次下载

    何谓直器,直器有什么作用

    直器是种光学仪器,用于调整光线的方向和形状,使其成为平行光束。它广泛应用于光学、激光、光纤通信、光学测量等领域。 直器的原理 直器的基本原理是利用透镜或反射镜对光线进行聚焦或发
    的头像 发表于 07-13 10:17 1940次阅读

    OpenCV携Orbbec 3D相机亮相CVPR 2024,加速AI视觉创新

    在科技发展的浪潮中,一年一度的IEEE国际计算机视觉与模式识别会议(CVPR)无疑是视觉技术领域的大盛事。今年的CVPR 2024于6月17日至2
    的头像 发表于 06-21 10:15 568次阅读

    OpenCV携奥比中光3D相机亮相CVPR 2024

    6月17日-21日,奥比中光合作伙伴OpenCV携Orbbec 3D相机参展在美国西雅图举办的CVPR 2024(即IEEE国际计算机视觉与模式识别会议),让开发者亲身体验Orbbec 3D相机
    的头像 发表于 06-21 09:38 504次阅读

    机器人3D视觉引导系统框架介绍

    通过自主开发的3D扫描仪可获准确并且快速地获取场景的云图像,通过3D识别算法,可实现在对云图中的多种目标物体进行识别和位姿估计。
    发表于 04-29 09:31 316次阅读
    机器人3D视觉引导系统框架介绍

    如何提取、匹配图像特征

    我们习惯从图像中选取比较有代表性的,然后,在此基础上,讨论相机位姿估计问题,以及这些的定位问题。 在经典 SLAM 模型中,把它们称为路标,而在视觉 SLAM 中,路标则是指图像
    的头像 发表于 04-19 11:41 608次阅读

    基于大模型的遥感图像变化检测新网络

    高分辨率遥感图像已经成为复杂变化检测的有力工具。然而,在复杂场景中执行稳健的变化检测仍然是个艰巨的挑战。变化检测聚焦“非语义变化”中的“有效变化”,即,由大气条件、遥感器、等引起
    发表于 01-12 16:42 1007次阅读
    基于大模型的遥感<b class='flag-5'>图像</b>变化检测新网络

    图像处理怎么入门?

    总之图像处理的基本思想还是要立足于图像本身,要深度到图像内部结构中,思维要灵活。我当时本科毕设时,怎么也不知道图像和高维空间中的
    的头像 发表于 01-08 09:51 375次阅读

    RL究竟是如何与LLM结合的?

    强化学习(Reinforcement Learning, RL)的核心概念可简单概括为:个机器人(Agent)在看到了些信息(Observation)后,自己做出个决策(Acti
    的头像 发表于 01-03 16:34 1084次阅读
    <b class='flag-5'>RL</b>究竟是如何与LLM<b class='flag-5'>做</b>结合的?

    网故障定位装置|让电力系统的故障无处遁形!

    种神奇的设备——网故障定位装置。��� 、什么是网故障定位装置? 网故障定位装置,顾名思义,是种用于定位电网中故障的设备。它能够实
    的头像 发表于 12-18 10:29 2339次阅读
    <b class='flag-5'>配</b>网故障定位装置|让电力系统的故障无处遁形!

    通过将异步获取的图像与LiDAR云对准的方案

    实现图像与其重建对象之间的精确2D-3D对应关系对于准确的图像定位至关重要,种有前景的方法涉及在图像和激光雷达平面之间建立对应关系,激光雷达平面可以被视为来自激光雷达
    发表于 12-12 14:46 700次阅读

    PCL滤波常用的滤波方式

    最近在看PCL滤波等操作,之前在自动驾驶-激光雷达预处理/特征提取和提到了些滤除云等操作,但是最近作者发现里面还有
    的头像 发表于 11-28 11:24 573次阅读

    关于图像传感器图像质量的四大误区!你踩过几个坑?

    关于图像传感器图像质量的四大误区!你踩过几个坑?
    的头像 发表于 11-27 16:56 424次阅读
    <b class='flag-5'>关于</b><b class='flag-5'>图像</b>传感器<b class='flag-5'>图像</b>质量的四大误区!你踩过几个坑?