0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一篇关于CVPR‘21使用RL做点云图像配准

新机器视觉 来源:强化学习技术前沿 作者:东林钟声 2021-07-02 08:57 次阅读

深度强化学习(Deep RL)可以通过序列决策式的方式,在很多方面得到应用。这里我们主要介绍一篇CVPR‘21使用RL做点云图像配准的文章:ReAgent: Point Cloud Registration using Imitation and Reinforcement Learninghttps://arxiv.org/abs/2103.15231

总体上而言,ReAgent是通过训练了一个Policy网络,状态是Source点云和Target点云,输出一系列动作(旋转、平移Source点云),使得Source点云最终和Target点云在相同的地方重合。那么我们现在深入其中的细节,其实针对RL的应用文章,最需要关注的点是以下4个方面:

状态(State)设计

动作(Action)设计

奖励(Reward)设计

算法实现

一般来说RL的应用文章在算法上无非使用的是较为广泛使用的算法模型,如DQN、PPO、SAC等。

State

这里的State是将Source和Targe点云通过一个PointNet类似的结构,从高维点云信息Embedding到一个特征空间后,两者Concatenate得到State的表征信息。这里从上图中可以比较好的理解。

Action

这里Action的选择就比较直观,我们需要通过一些操作来旋转、平移Source点云。那么Action就直接设置为旋转、平移相关的动作。这篇文章在实现上,使用离散的动作集,比如x方向的平移为[0.0033,0.01,0.03,0.09,0.27],当然是有正有负。

Reward

Reward的设计就更为直观,就是在执行动作后,看是否Source和Target之间更加接近了。这里使用的是Chamfer Distance(CD)来衡量,下面给出Reward的设计:

4982f126-dacc-11eb-9e57-12bb97331649.png

这里的Reward也很直观,就是加入执行动作之后,是否变得更好?如果变好了就给一个正的奖励,如果变差了就给一个负的奖励。

算法实现

文章采用了PPO。那么ReAgent的总体框架就如下图:

49a7c88e-dacc-11eb-9e57-12bb97331649.png

如果理解了这个问题中的State、Action的设计,还是相当直观的框架。同时笔者也跑通了ReAgent的代码,实际看下其效果如何,主要是观察其序列动作过程

可以看到ReAgent的动作还是相当“丝滑“”且准确的。也希望更多的读者能够探索RL的各种应用,做到像人一样“丝滑”~

—版权声明—

来源:强化学习技术前沿

仅用于学术分享,版权属于原作者。

若有侵权,请联系微信号: 删除或修改!

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 代码
    +关注

    关注

    30

    文章

    4857

    浏览量

    69465
  • 深度强化学习

    关注

    0

    文章

    14

    浏览量

    2332

原文标题:深度强化学习点云配准——ReAgent技术详解

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    怎么用DLP4500投影图像

    请问怎么用DLP4500投影图像吗。英文的指导手册看了,但是不太懂,自己尝试做,不出来 能给些详细一点的教程指导吗
    发表于 02-27 07:13

    电钟:关于GPS北斗卫星授时服务部署方案

    电钟:关于GPS北斗卫星授时服务部署方案
    的头像 发表于 02-25 09:54 111次阅读
    京<b class='flag-5'>准</b>电钟:<b class='flag-5'>关于</b>GPS北斗卫星授时服务部署方案

    电钟:关于北斗授时服务器技术应用方案

    电钟:关于北斗授时服务器技术应用方案
    的头像 发表于 02-17 16:26 118次阅读

    FRED应用: LED混合直透镜模拟

    ,我们看个混合直透镜的示例。 FRED模型 LED在整个半球上发光,但是大多数照明应用中要求对输出的光的方向进行控制。个简单的正透镜不足以将大角度光折射成准直光束。为了重新定向所有发射光,可以
    发表于 01-15 09:37

    使用adc12dj3200设计,该上电顺序是必须要守的吗?

    最近在使用adc12dj3200设计,该芯片使用两种电压:1.9V与1.1V。手册上推荐1.9V先于1.1V上电。该上电顺序是必须要守的吗?如果没有按照推荐的上电顺序设计,此芯片能否正常工作?谢谢
    发表于 12-11 08:38

    使用语义线索增强局部特征匹配

    视觉匹配是关键计算机视觉任务中的关键步骤,包括摄像机定位、图像和运动结构。目前最有效的匹配关键的技术包括使用经过学习的稀疏或密集匹配器,这需要成对的
    的头像 发表于 10-28 09:57 420次阅读
    使用语义线索增强局部特征匹配

    为什么在水文计算中广泛采用线法

    在水文计算中广泛采用线法(或称适线法),主要基于以下几个方面的原因: 、理论依据坚实 线法以经验频率据为基础,通过求解与经验据拟合
    的头像 发表于 09-19 16:10 611次阅读

    基于VDMA的远程图像采集系统参考设计

    本文参考设计基于 AMD ZYNQ 7000 Device, 使用 VDMA 原始图像采集系统,在 Petalinux 下服务器,通过 Socket 发送图像至 Windows 或
    的头像 发表于 09-18 10:11 670次阅读
    基于VDMA的远程<b class='flag-5'>图像</b>采集系统参考设计

    Labview实现自定义四维云图(三维曲面图像)可视化显示

    Labview自带有三维曲面图形绘制函数,并可在曲面表面完成云图可视化显示,但是其颜色范围由矩阵Z的最大、最小值自动配置,无法进行用户自定义灵活配置,因此本文在Labview自带的三维曲面图形绘制
    发表于 07-16 10:52 59次下载

    直器的位置及作用

    直器是种光学器件,主要用于将光线或射线束聚焦或整形成平行或平行的光束。在各种光学系统、成像系统、测量系统和医疗设备中,直器都发挥着重要的作用。
    的头像 发表于 07-13 10:41 2753次阅读

    何谓直器,直器有什么作用

    直器是种光学仪器,用于调整光线的方向和形状,使其成为平行光束。它广泛应用于光学、激光、光纤通信、光学测量等领域。 直器的原理 直器的基本原理是利用透镜或反射镜对光线进行聚焦或发
    的头像 发表于 07-13 10:17 3706次阅读

    OpenCV携Orbbec 3D相机亮相CVPR 2024,加速AI视觉创新

    在科技发展的浪潮中,一年一度的IEEE国际计算机视觉与模式识别会议(CVPR)无疑是视觉技术领域的大盛事。今年的CVPR 2024于6月17日至2
    的头像 发表于 06-21 10:15 721次阅读

    OpenCV携奥比中光3D相机亮相CVPR 2024

    6月17日-21日,奥比中光合作伙伴OpenCV携Orbbec 3D相机参展在美国西雅图举办的CVPR 2024(即IEEE国际计算机视觉与模式识别会议),让开发者亲身体验Orbbec 3D相机
    的头像 发表于 06-21 09:38 699次阅读

    机器人3D视觉引导系统框架介绍

    通过自主开发的3D扫描仪可获准确并且快速地获取场景的云图像,通过3D识别算法,可实现在对云图中的多种目标物体进行识别和位姿估计。
    发表于 04-29 09:31 414次阅读
    机器人3D视觉引导系统框架介绍

    如何提取、匹配图像特征

    我们习惯从图像中选取比较有代表性的,然后,在此基础上,讨论相机位姿估计问题,以及这些的定位问题。 在经典 SLAM 模型中,把它们称为路标,而在视觉 SLAM 中,路标则是指图像
    的头像 发表于 04-19 11:41 770次阅读