0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook让机器人学会了自主绕道走路

Hf1h_BigDataDig 来源:fqj 2019-06-06 14:21 次阅读

人类每天都在进行不同层次的规划活动,比如说每天早上起床以后,你习惯性走到厨房喝一杯咖啡:你会先走下走廊,左转进入过道,然后进入右边的房间。

对于这些习惯成自然的流程,你无需思考,不会刻意去想你要使用哪一个肢体动作。但对于机器人而言,这并非易事。

Facebook刚刚发布了主导研究的新系统,让机器人也可以通过观看视频拆解动作,并学习如何组合这些动作形成自己的规划。

层级抽象结构(hierarchal abstractions)

已经有越来越多的研究表明,层级抽象结构(即视觉运动子程序)可以提高强化学习中的采样效率,这是一种利用奖励驱动智能体达到目标的AI训练技术。

在过去,这些层次结构必须通过端到端的训练来手动编码或获取,而这需要大量的时间、注意力和长久的耐心。

Facebook这次的新研究提出,刻意让机器人通过观看视频学习导航,描述一个通过用逆向机器学习模型摄取视频伪标签(在本文中,伪标签指智能体想象的行为),从而学习层次结构的系统。

论文作者分别来自Facebook AI研究室,加州大学伯克利分校和伊利诺伊大学厄巴纳—香槟分校。

这让人想起去年Facebook开源的一组模型——Talk the Walk。它只需要360°的全景图像、自然语言以及一张有当地地标(比如银行和餐馆)的地图就可以通过问路,实现在整个纽约市的街道导航。

具体实现方式

机器人通过观看这些视频,研究这些简单的视觉运动子程序是如何组合以达到高级的抽象层次,这些视觉运动子程序能够解决一些已知问题,即经典的规划中的高计算成本和强化学习中的样本复杂性的问题。

研究者提出的系统分为两个阶段,在第一阶段,研究人员通过运行在随机探索数据上自我监督的智能体模型生成伪标签。模型从分布在四个环境中的1500个不同位置学习,在不同的位置随机执行30个不同步骤的动作,从而产生45,000个交互样本。

在系统的第二阶段,大约217,000个伪标记视频被剪辑成220万个单独的小视频,再将其输入预测参考视频中相应动作的模型,同时再通过一个单独的网络检查参考视频中的动作序列,并编码其行为作为向量。另一个模型通过推断第一帧的轨迹的编码,来预测哪一个子程序可以调用给已有的视频帧。

交互样本从1000万减少到4.5万

在一个部署在办公环境的真实世界中的机器人实验中,研究人员表明,相比单纯交互的方法,至少应用在之前从未见过的环境上,通过观看视频来学习技能(这里指采用最高效的方式前往目标位置)的方式能达到更好的效果。

最令人印象深刻的是,训练有素的模型学会了自主地前进导航并避开障碍物,比通过单纯交互方式要快4倍,这使得机器人能够做到完全自主地长距离行进。

“特别引人注目的是,这些模型从总计45,000次的环境交互中学习,”研究人员写道,“从第一视角的视频中成功学习,使得智能体能够执行连贯的轨迹,即使它只执行过随机动作。此外,它优于最先进的技能学习技术,该技术需要更大量的训练样本,大致1000万个。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28066

    浏览量

    205762
  • Facebook
    +关注

    关注

    3

    文章

    1429

    浏览量

    54604

原文标题:Facebook让机器人“观看”上万次视频后,TA学会了自主绕道走路

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    麻省理工学院推出新型机器人训练模型

    近日,据TechCrunch报道,麻省理工学院的研究团队展示了一种创新的机器人训练模型,该模型突破了传统模仿学习方法的局限,不再依赖标准数据集,而是借鉴了大型语言模型(LLM)如GPT-4等所使用的大规模信息处理方式,为机器人学习新技能开辟了全新的道路。
    的头像 发表于 11-04 14:56 221次阅读

    机器人的三大矩阵是什么及关系式

    机器人学中,三大矩阵主要指的是与机器人位移、速度和力相关的矩阵,它们分别揭示了机器人在不同空间(如关节空间和作业空间)之间的映射关系。这三大矩阵及其关系式可以概括如下: 1. T矩阵(变换矩阵
    的头像 发表于 09-04 09:37 615次阅读

    “卷不动了”?OTA来救场!智能机器人“永葆青春”的秘诀

    的扫地机器人突然学会了拖地,是不是很酷?OTA就是这种“逆天改命”成为可能的魔法! 1、智能机器人的发展趋势与OTA机遇 智能机器人3.0
    的头像 发表于 08-06 16:01 330次阅读
    “卷不动了”?OTA来救场!智能<b class='flag-5'>机器人</b>“永葆青春”的秘诀

    ROS机器人开发更便捷,基于RK3568J+Debian系统发布!

    本帖最后由 Tronlong创龙科技 于 2024-7-19 17:18 编辑 ROS系统是什么 ROS(Robot Operating System)是一个适用于机器人的开源的元操作系统。它
    发表于 07-09 11:38

    NVIDIA Isaac 机器人平台利用最新的生成式 AI 和先进的仿真技术,加速 AI 机器人技术的发展

    观众展示了用于人形机器人学习的通用基础模型 Project GR00T(代表通用机器人 00 技术)。Project GR00T 利用 NVIDIA Isaac 机器人平台的各种工具来创建用于人形
    的头像 发表于 06-04 18:00 7603次阅读
    NVIDIA Isaac <b class='flag-5'>机器人</b>平台利用最新的生成式 AI 和先进的仿真技术,加速 AI <b class='flag-5'>机器人</b>技术的发展

    奥比中光携手新加坡LionsBot,智能清洁机器人落地超过30个国家

    近年来,随着AI 3D视觉技术飞速发展,各类创新型自主移动机器人不断涌现。行业领先的机器人视觉与AI视觉科技公司奥比中光与新加坡自主清洁机器人
    的头像 发表于 04-16 09:32 530次阅读

    NVIDIA Isaac机器人平台升级,加速AI机器人技术革新

    NVIDIA Isaac机器人平台近期实现重大升级,通过引入最新的生成式AI技术和先进的仿真技术,显著加速了AI机器人技术的发展步伐。该平台正不断扩展其基础模型、机器人学习框架、AI工作流编排以及
    的头像 发表于 03-27 10:36 600次阅读

    机器人学习中主流智能抓取方案

    RGB颜色空间由红绿蓝三种基本色组成,叠加成任意色彩,同样地,任意一种颜色也可以拆解为三种基本色的组合,机器人通过颜色坐标值来理解“颜色”。
    发表于 03-13 10:07 270次阅读
    <b class='flag-5'>机器人学</b>习中主流智能抓取方案

    自主移动机器人(AMR)功能和特点

    复合机器人是一种集成了移动机器人、协作机器人机器视觉等多项功能的新型机器人。它的开发目的是为了解决工厂物流中最后一米的问题,提供智能搬运解
    的头像 发表于 02-28 15:05 1877次阅读
    <b class='flag-5'>自主</b>移动<b class='flag-5'>机器人</b>(AMR)功能和特点

    5个问题,洞悉自主移动机器人未来发展方向

    随着科技的日新月异,人类与机器人的互动将愈发频繁。从早晨在本地咖啡店里,协作机器人(cobot)为顾客精心冲泡咖啡,到在仓库中,自主移动机器人(AMR)自由穿梭各处拣选包裹。协作
    的头像 发表于 01-09 08:30 639次阅读
    5个问题,洞悉<b class='flag-5'>自主</b>移动<b class='flag-5'>机器人</b>未来发展方向

    倍加福传感器AGV/AMR机器人工作更自主

    技术,AGV/AMR机器人工作更自主。通过对倍加福产品及解决方案的展示,充分呈现了倍加福如何以前沿创新的传感器科技,为AGV/AMR 应用提供更完善的一站式解决方案,为物流行业智能化注入了新的活力。
    的头像 发表于 12-22 13:50 813次阅读

    工业机器人产业发展及应用现状

    机器人(Robot)是一种能够半自主或全自主工作的智能机器机器人能够通过编程和自动控制来执行诸如作业或移动等任务。根据制造目的的不同,
    发表于 12-21 16:07 1321次阅读
    工业<b class='flag-5'>机器人</b>产业发展及应用现状

    ROS机器人开发更便捷,基于RK3568J+Debian系统发布!

    ROS系统是什么 ROS(Robot Operating System)是一个适用于机器人的开源的元操作系统。它提供了操作系统应有的服务,包括硬件抽象,底层设备控制,常用函数的实现,进程间消息传递
    发表于 11-30 16:01

    机器人中都有哪些坐标系

    坐标系是我们非常熟悉的一个概念,也是机器人学中的重要基础,在一个完整的机器人系统中,会存在很多坐标系,这些坐标系之间的位置关系该如何管理? ROS给我们提供了一个坐标系的管理神器——TF。 机器人
    的头像 发表于 11-22 17:20 1381次阅读
    <b class='flag-5'>机器人</b>中都有哪些坐标系

    目前几种主流的机器人智能抓取系统方案

    机器人学习中的经典问题之一便是分拣:在一堆无序摆放的物品堆中,取出目标物品。
    的头像 发表于 11-14 14:20 1524次阅读
    目前几种主流的<b class='flag-5'>机器人</b>智能抓取系统方案