0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于端到端可操作性学习的机器人操纵框架

CVer 来源:北京大学前沿计算研究中 2023-01-30 09:55 次阅读

导 读

本文是国际机器人和自动化顶级会议 ICRA 2023入选论文 RLAfford:End-to-end Affordance Learning for Robotic Manipulation 的解读。这项研究通过使用强化学习训练过程中产生的接触信息来预测物体可操作性信息,更好地实现机器人***任务,并对各种算法以及环境具有即插即用的能力。

01

研究背景

随着生活逐渐智能化,通过机器人与物体交互变得越来越重要。如何让机器人学会***不同形状的物体并且学会稳定有效的交互策略成为了当前的研究热点。近年来,强化学习(RL)为这一问题提供了解决方案。然而,在互动环境中学习***不同形状、不同结构、不同功能的三维物体一直是强化学习的挑战。特别是,我们往往很难训练出一个能够处理不同语义类别、不同几何形状和多样功能的物体的策略。

最近,视觉可操作性(Visual Affordance)学习技术在提供以物体为中心的信息先验和有效的可操作语义方面展现出巨大的潜力。例如,一个理想的策略可以通过了解到把手的可操作性来打开一扇门。然而,学习视觉可操作性往往需要人类定义的原子动作(抓、握、推、拉等动作),这限制了适用任务的范围。

在本文中,我们提出了 RLAfford。在研究中,我们抓住了智能体与世界交互的最本质信息:接触点信息,来预测 RL 系统感兴趣的物体上的接触位置(也即物体的可操作性),预测的信息又反过来指导 RL 进一步训练。这样的接触预测系统实现了端到端(End-to-end)的 Visual Affordance 学习框架,它可以广泛地适用于不同类型的***任务中。

令人兴奋的是,我们的框架甚至在多阶段(Multi-stage)和多智能体(Multi-agent)的任务中也能保持有效性。我们在八种类型的***任务上测试了我们的方法。结果显示,我们的方法在成功率上远远超过了基线(Baseline)算法,同时,我们的方法成功地在现实世界中成功完成了这八种***任务。部分VisualAffordance 学习结果如图1所示。

00a8e546-9fce-11ed-bfe3-dac502259ad0.png

图1. 输入一个物体的点云信息,我们利用 RL 交互过程中的接触信息来预测以物体为中心的可操作性信息。图中颜色越深意味着可操作性越强。可以看出,这样的信息对于完成物体操作非常有意义。

02

方 法

00b9c15e-9fce-11ed-bfe3-dac502259ad0.png

图2. 框架结构。

如图2所示,我们的方案包含两个主要模块。其中 1)操作模块(Manipulation Module)生成交互轨迹,2)视觉可操作性模块(Visual Affordance Module)用来学习生成基于实时点云的可操作性信息(Affordance)。接触预测器(Contact Predictor)在两个模块***享,作为它们之间的桥梁。

操作模块使用接触预测器的预测结果作为输入观察的一部分,同时预测的最大值点参与操作模块的奖励函数计算(MPR),以激励 RL 算法去探索最感兴趣的点附近的区域;

操作模块通过收集交互中的碰撞信息实时生成动态的 Visual Affordance 学习目标(Dynamic Ground Truth)来训练视觉可操作性模块

具体算法结构如图3所示。

00c6f018-9fce-11ed-bfe3-dac502259ad0.png

图3. 算法结构。

03

实 验

00d7ffb6-9fce-11ed-bfe3-dac502259ad0.png

图4. 顶部:模拟器中的任务设置。中间:在端到端训练期间,Visual Affordance Map 的变化以及部分 Visual Affordance 学习结果。底部:真实世界实验示意图。

如图4所示,我们设计了三种类型的***任务:单阶段、多阶段和多智能体。在所有的任务中,都要求一个或两个机械臂来完成对不同物体的特定***任务。我们使用了 Isaac Gym 物理模拟器、PartNet-Mobility 数据集和 VAPO 数据集来完成虚拟环境的实验。我们也利用了数字孪生方法在真实世界中完成了我们设计的任务。最终,我们进行了一些消融实验,实验结果表明我们的方法在成功率上远远超过了基线算法,包括基于 Visual Affordance 的方法和 RL 方法。

04

总 结

据我们所知,这是第一项将 Visual Affordance 与 RL 完成端到端的结合的工作。在 RL 训练中,VisualAffordance可以通过提供额外的观测和奖励信号来提高策略学习的效果。我们的框架通过 RL 训练自动学习VisualAffordance语义,而不需要额外的演示或人工标注。我们方法的简单性、比所有基线更出色的性能以及广泛灵活的适用场景,证明了我们的方案的有效性以及对各种算法、环境具有即插即用的能力,同时也为解决更多复杂任务打开了一种新的思路。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28380

    浏览量

    206918
  • 模拟器
    +关注

    关注

    2

    文章

    874

    浏览量

    43208
  • MPR
    MPR
    +关注

    关注

    0

    文章

    6

    浏览量

    8721

原文标题:ICRA 2023 | RLAfford:基于端到端可操作性学习的机器人操纵框架

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    #机器人基础原理 奇异及可操作性第1部分

    机器人
    电子技术那些事儿
    发布于 :2022年09月21日 22:52:33

    #机器人基础原理 奇异及可操作性第2部分

    机器人
    电子技术那些事儿
    发布于 :2022年09月21日 22:54:43

    水下机器人便携式遥控单元设计

    进行复杂的坐标变换,并将变换结果和载体状态以图形化的界面生动、直观的显示出来。这大大提高了水下机器人在水面上的可操作性,方便每次的水上试验与载体回收。以下我们以AVR系列单片机ATmega1280和步科
    发表于 03-08 14:21

    蓝牙控制机器人

    蓝牙控制机器人蓝牙控制机器人(android版,支持2.2及2.2以上系列手机),内有hex文件资料及详细说明attach://147401.rar
    发表于 07-20 09:35

    什么是工业机器人

    ,完成对人体有害物料的搬运或工艺操作。20世纪50年代末,美国在机械手和操作机的基础上,采用伺服机构和自动控制等技术,研制出有通用的独立的工业用自动操作装置,并将其称为工业
    发表于 01-19 10:58

    智能小车机器人控制V2.02

    智能小车机器人控制V2.02
    发表于 04-12 13:04

    【orangepi zero申请】画图机器人控制

    项目名称:画图机器人控制试用计划:目前做了一个画图机器人,使用电脑处理图片和控制的,但是为了增加这个项目的集成度,打算将控制的软件安装在这个板子上,低廉的成本实现整个项目功能。我玩
    发表于 12-09 09:31

    机器宠物解决方案开源资料(原理图+源码+视频演示)

    手掌大小的机器人,它有四只脚而不是轮子。腿式运动赋予其在非结构化地形上导航的更多自由,并在运动时表达生活的欢乐。这种动态的可操作性以前只能在最好的实验室或大亨公司的一些豪华机器人上看到。于是提出了一
    发表于 10-12 14:38

    深圳视觉对位雕刻机系统,软件可操作性

    。8、光学玻璃行业。视觉对位雕刻机系统特点:1、高精度、高效率、高稳定性的视觉对位算法2、使用网口相机和集成工控机,性能稳定可靠3、软件可操作性好,触摸屏方便、简洁4、可根据客户具体机型进行定制化的高效
    发表于 07-22 09:52

    深圳CCD点钻系统,视觉对位算法,可操作性

    、高精度、高效率、高稳定性的视觉对位算法2、使用网口相机和集成工控机,性能稳定可靠3、软件可操作性好,触摸屏方便、简洁4、可根据客户具体机型进行定制化的高效方案四元数致力于运动控制、图像与视觉传感等工业
    发表于 07-27 09:36

    浅谈儿童陪护机器人

    、高电流的步进电机驱动芯片,可以提供可靠、高效的控制性能,拥有电流细分、过流保护、过热保护等特点,适用于需要高速、高精度转动的机器人应用。 在实际应用中,儿童陪护机器人的转动控制也需要考虑安全
    发表于 05-11 15:12

    TD-LTE完成全球首个操作性试验

    TD-LTE完成全球首个操作性试验 近日,爱立信在瑞典进行了TD-LTE
    发表于 04-25 13:55 636次阅读

    高通、诺基亚完成基于全球5G NR标准的操作性连接测试

    高通公司总裁Cristiano Amon表示:“高通与诺基亚成功完成的这一项基于全球5G NR标准的操作性连接测试,为在2019年顺利推出5G NR商用网络和终端设备奠定了坚实
    的头像 发表于 02-08 16:11 5048次阅读

    HPC应用程序高性能分析及如何使用系统资源的可操作性洞察

    探索HPC性能表征分析,以获得有效计算密集型应用程序如何使用系统资源的可操作性洞察。
    的头像 发表于 11-08 06:11 3471次阅读

    双臂协作机器人的应用场景

    双臂协作机器人的核心是双臂多关节结构和机器人操作系统,每条臂都有高灵活性的七个自由度,比单臂协作机器人有更高的灵活性和可操作性,通过双臂配合
    的头像 发表于 06-27 09:08 1389次阅读
    双臂协作<b class='flag-5'>机器人</b>的应用场景