一篇关于CVPR‘21使用RL做点云图像配准-电子发烧友网

深度强化学习（Deep RL）可以通过序列决策式的方式，在很多方面得到应用。这里我们主要介绍一篇CVPR‘21使用RL做点云图像配准的文章：ReAgent： Point Cloud Registration using Imitation and Reinforcement Learninghttps://arxiv.org/abs/2103.15231

总体上而言，ReAgent是通过训练了一个Policy网络，状态是Source点云和Target点云，输出一系列动作（旋转、平移Source点云），使得Source点云最终和Target点云在相同的地方重合。那么我们现在深入其中的细节，其实针对RL的应用文章，最需要关注的点是以下4个方面：

状态（State）设计

动作（Action）设计

奖励（Reward）设计

算法实现

一般来说RL的应用文章在算法上无非使用的是较为广泛使用的算法模型，如DQN、PPO、SAC等。

State

这里的State是将Source和Targe点云通过一个PointNet类似的结构，从高维点云信息Embedding到一个特征空间后，两者Concatenate得到State的表征信息。这里从上图中可以比较好的理解。

Action

这里Action的选择就比较直观，我们需要通过一些操作来旋转、平移Source点云。那么Action就直接设置为旋转、平移相关的动作。这篇文章在实现上，使用离散的动作集，比如x方向的平移为［0.0033，0.01，0.03，0.09，0.27］，当然是有正有负。

Reward

Reward的设计就更为直观，就是在执行动作后，看是否Source和Target之间更加接近了。这里使用的是Chamfer Distance（CD）来衡量，下面给出Reward的设计：

这里的Reward也很直观，就是加入执行动作之后，是否变得更好？如果变好了就给一个正的奖励，如果变差了就给一个负的奖励。

算法实现

文章采用了PPO。那么ReAgent的总体框架就如下图：

如果理解了这个问题中的State、Action的设计，还是相当直观的框架。同时笔者也跑通了ReAgent的代码，实际看下其效果如何，主要是观察其序列动作过程

可以看到ReAgent的动作还是相当“丝滑“”且准确的。也希望更多的读者能够探索RL的各种应用，做到像人一样“丝滑”~

来源：强化学习技术前沿

仅用于学术分享，版权属于原作者。

若有侵权，请联系微信号：删除或修改！

编辑：jq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

代码

代码

+关注

关注
30

文章
4857

浏览量
69465
深度强化学习

深度强化学习

+关注

关注
0

文章
14

浏览量
2332

原文标题：深度强化学习点云配准——ReAgent技术详解

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

怎么用DLP4500投影图像？

请问怎么用DLP4500投影图像吗。英文的指导手册看了，但是不太懂，自己尝试做，做不出来能给一些详细一点的教程指导吗

发表于 02-27 07:13

FRED应用： LED混合准直透镜模拟

，我们看一个混合准直透镜的示例。 FRED模型 LED在整个半球上发光，但是大多数照明应用中要求对输出的光的方向进行控制。一个简单的正透镜不足以将大角度光折射成准直光束。为了重新定向所有发射光，可以

发表于 01-15 09:37

使用adc12dj3200做设计，该上电顺序是必须要准守的吗？

最近在使用adc12dj3200做设计，该芯片使用两种电压：1.9V与1.1V。手册上推荐1.9V先于1.1V上电。该上电顺序是必须要准守的吗？如果没有按照推荐的上电顺序设计，此芯片能否正常工作？谢谢

发表于 12-11 08:38

使用语义线索增强局部特征匹配

视觉匹配是关键计算机视觉任务中的关键步骤，包括摄像机定位、图像配准和运动结构。目前最有效的匹配关键点的技术包括使用经过学习的稀疏或密集匹配器，这需要成对的

发表于 10-28 09:57 •420次阅读

为什么在水文计算中广泛采用配线法

在水文计算中广泛采用配线法（或称适线法），主要基于以下几个方面的原因：一、理论依据坚实配线法以经验频率点据为基础，通过求解与经验点据拟合

发表于 09-19 16:10 •611次阅读

基于VDMA的远程图像采集系统参考设计

本文参考设计基于 AMD ZYNQ 7000 Device，使用 VDMA 做原始图像采集系统，在 Petalinux 下做服务器，通过 Socket 发送图像至 Windows 或

发表于 09-18 10:11 •670次阅读

基于VDMA的远程<b class='flag-5'>图像</b>采集系统参考设计

Labview实现自定义四维云图(三维曲面图像)可视化显示

Labview自带有三维曲面图形绘制函数，并可在曲面表面完成云图可视化显示，但是其颜色范围由矩阵Z的最大、最小值自动配置，无法进行用户自定义灵活配置，因此本文在Labview自带的三维曲面图形绘制

发表于 07-16 10:52 •59次下载

准直器的位置及作用

准直器是一种光学器件，主要用于将光线或射线束聚焦或整形成平行或准平行的光束。在各种光学系统、成像系统、测量系统和医疗设备中，准直器都发挥着重要的作用。

发表于 07-13 10:41 •2753次阅读

何谓准直器,准直器有什么作用

准直器是一种光学仪器，用于调整光线的方向和形状，使其成为平行光束。它广泛应用于光学、激光、光纤通信、光学测量等领域。准直器的原理准直器的基本原理是利用透镜或反射镜对光线进行聚焦或发

发表于 07-13 10:17 •3706次阅读

OpenCV携Orbbec 3D相机亮相CVPR 2024，加速AI视觉创新

在科技发展的浪潮中，一年一度的IEEE国际计算机视觉与模式识别会议（CVPR）无疑是视觉技术领域的一大盛事。今年的CVPR 2024于6月17日至2

发表于 06-21 10:15 •721次阅读

OpenCV携奥比中光3D相机亮相CVPR 2024

6月17日-21日，奥比中光合作伙伴OpenCV携Orbbec 3D相机参展在美国西雅图举办的CVPR 2024（即IEEE国际计算机视觉与模式识别会议），让开发者亲身体验Orbbec 3D相机

发表于 06-21 09:38 •699次阅读

机器人3D视觉引导系统框架介绍

通过自主开发的3D扫描仪可获准确并且快速地获取场景的点云图像，通过3D识别算法，可实现在对点云图中的多种目标物体进行识别和位姿估计。

发表于 04-29 09:31 •414次阅读

如何提取、匹配图像特征点

我们习惯从图像中选取比较有代表性的点，然后，在此基础上，讨论相机位姿估计问题，以及这些点的定位问题。在经典 SLAM 模型中，把它们称为路标，而在视觉 SLAM 中，路标则是指图像

发表于 04-19 11:41 •770次阅读

搜索历史

一篇关于CVPR‘21使用RL做点云图像配准

评论

怎么用DLP4500投影图像？

京准电钟：关于GPS北斗卫星授时服务部署方案

京准电钟：关于北斗授时服务器技术应用方案