0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook让机器人学会了自主绕道走路

Hf1h_BigDataDig 来源:fqj 2019-06-06 14:21 次阅读

人类每天都在进行不同层次的规划活动,比如说每天早上起床以后,你习惯性走到厨房喝一杯咖啡:你会先走下走廊,左转进入过道,然后进入右边的房间。

对于这些习惯成自然的流程,你无需思考,不会刻意去想你要使用哪一个肢体动作。但对于机器人而言,这并非易事。

Facebook刚刚发布了主导研究的新系统,让机器人也可以通过观看视频拆解动作,并学习如何组合这些动作形成自己的规划。

层级抽象结构(hierarchal abstractions)

已经有越来越多的研究表明,层级抽象结构(即视觉运动子程序)可以提高强化学习中的采样效率,这是一种利用奖励驱动智能体达到目标的AI训练技术。

在过去,这些层次结构必须通过端到端的训练来手动编码或获取,而这需要大量的时间、注意力和长久的耐心。

Facebook这次的新研究提出,刻意让机器人通过观看视频学习导航,描述一个通过用逆向机器学习模型摄取视频伪标签(在本文中,伪标签指智能体想象的行为),从而学习层次结构的系统。

论文作者分别来自Facebook AI研究室,加州大学伯克利分校和伊利诺伊大学厄巴纳—香槟分校。

这让人想起去年Facebook开源的一组模型——Talk the Walk。它只需要360°的全景图像、自然语言以及一张有当地地标(比如银行和餐馆)的地图就可以通过问路,实现在整个纽约市的街道导航。

具体实现方式

机器人通过观看这些视频,研究这些简单的视觉运动子程序是如何组合以达到高级的抽象层次,这些视觉运动子程序能够解决一些已知问题,即经典的规划中的高计算成本和强化学习中的样本复杂性的问题。

研究者提出的系统分为两个阶段,在第一阶段,研究人员通过运行在随机探索数据上自我监督的智能体模型生成伪标签。模型从分布在四个环境中的1500个不同位置学习,在不同的位置随机执行30个不同步骤的动作,从而产生45,000个交互样本。

在系统的第二阶段,大约217,000个伪标记视频被剪辑成220万个单独的小视频,再将其输入预测参考视频中相应动作的模型,同时再通过一个单独的网络检查参考视频中的动作序列,并编码其行为作为向量。另一个模型通过推断第一帧的轨迹的编码,来预测哪一个子程序可以调用给已有的视频帧。

交互样本从1000万减少到4.5万

在一个部署在办公环境的真实世界中的机器人实验中,研究人员表明,相比单纯交互的方法,至少应用在之前从未见过的环境上,通过观看视频来学习技能(这里指采用最高效的方式前往目标位置)的方式能达到更好的效果。

最令人印象深刻的是,训练有素的模型学会了自主地前进导航并避开障碍物,比通过单纯交互方式要快4倍,这使得机器人能够做到完全自主地长距离行进。

“特别引人注目的是,这些模型从总计45,000次的环境交互中学习,”研究人员写道,“从第一视角的视频中成功学习,使得智能体能够执行连贯的轨迹,即使它只执行过随机动作。此外,它优于最先进的技能学习技术,该技术需要更大量的训练样本,大致1000万个。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28504

    浏览量

    207486
  • Facebook
    +关注

    关注

    3

    文章

    1429

    浏览量

    54808

原文标题:Facebook让机器人“观看”上万次视频后,TA学会了自主绕道走路

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

    具身智能机器人的基础模块,这个是本书的第二部分内容,主要分为四个部分:机器人计算系统,自主机器人的感知系统,自主机器人的定位系统,自主机器人
    发表于 01-04 19:22

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    中取得了令人瞩目的效果。 阅读感悟 从传统的手动编程到借助大模型实现智能化、自主化,从单一模态的交互到多模态信息的深度融合,再到扩散模型的应用,机器人控制技术正在以惊人的速度进化。这不仅机器
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    工智能 认知发展机器人学 进化机器人学 物理体现与互动 五、具身智能的现代技术方向 另外,随着GPT等大语言模型的发展,这些技术也在具身智能机器人领域掀起了一股浪潮,那就是基于大模型的具身智能技术
    发表于 12-28 21:12

    【「具身智能机器人系统」阅读体验】+初品的体验

    动态互动的。 该理论强调智能行为源于智能体的物理存在和行为能力,智能体必须具备感知环境并在其中执行任务的能力。具身智能的实现涵盖了机器学习、人工智能、机器人学、计算机视觉、自然语言处理及强化学习等领域
    发表于 12-20 19:17

    《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

    的导引,读者对于具身智能机器人系统的相关背景知识、基础模块都有一个初步的认识和掌握。除了在\"5.3.2 自主机器人定位算法原理”这一小节将基于贝叶斯滤波的机器人定位部分,涉及有需要
    发表于 12-19 22:26

    NVIDIA发布全新AI和仿真工具以及工作流

    NVIDIA 在本周于德国慕尼黑举行的机器人学习大会(CoRL)上发布了全新 AI 和仿真工具以及工作流。机器人开发者可以使用这些工具和工作流,大大加快 AI 机器人(包括人形机器人
    的头像 发表于 11-09 11:52 301次阅读

    麻省理工学院推出新型机器人训练模型

    近日,据TechCrunch报道,麻省理工学院的研究团队展示了一种创新的机器人训练模型,该模型突破了传统模仿学习方法的局限,不再依赖标准数据集,而是借鉴了大型语言模型(LLM)如GPT-4等所使用的大规模信息处理方式,为机器人学习新技能开辟了全新的道路。
    的头像 发表于 11-04 14:56 506次阅读

    机器人的三大矩阵是什么及关系式

    机器人学中,三大矩阵主要指的是与机器人位移、速度和力相关的矩阵,它们分别揭示了机器人在不同空间(如关节空间和作业空间)之间的映射关系。这三大矩阵及其关系式可以概括如下: 1. T矩阵(变换矩阵
    的头像 发表于 09-04 09:37 1615次阅读

    “卷不动了”?OTA来救场!智能机器人“永葆青春”的秘诀

    的扫地机器人突然学会了拖地,是不是很酷?OTA就是这种“逆天改命”成为可能的魔法! 1、智能机器人的发展趋势与OTA机遇 智能机器人3.0
    的头像 发表于 08-06 16:01 442次阅读
    “卷不动了”?OTA来救场!智能<b class='flag-5'>机器人</b>“永葆青春”的秘诀

    ROS机器人开发更便捷,基于RK3568J+Debian系统发布!

    本帖最后由 Tronlong创龙科技 于 2024-7-19 17:18 编辑 ROS系统是什么 ROS(Robot Operating System)是一个适用于机器人的开源的元操作系统。它
    发表于 07-09 11:38

    NVIDIA Isaac 机器人平台利用最新的生成式 AI 和先进的仿真技术,加速 AI 机器人技术的发展

    观众展示了用于人形机器人学习的通用基础模型 Project GR00T(代表通用机器人 00 技术)。Project GR00T 利用 NVIDIA Isaac 机器人平台的各种工具来创建用于人形
    的头像 发表于 06-04 18:00 7726次阅读
    NVIDIA Isaac <b class='flag-5'>机器人</b>平台利用最新的生成式 AI 和先进的仿真技术,加速 AI <b class='flag-5'>机器人</b>技术的发展

    奥比中光携手新加坡LionsBot,智能清洁机器人落地超过30个国家

    近年来,随着AI 3D视觉技术飞速发展,各类创新型自主移动机器人不断涌现。行业领先的机器人视觉与AI视觉科技公司奥比中光与新加坡自主清洁机器人
    的头像 发表于 04-16 09:32 619次阅读

    NVIDIA Isaac机器人平台升级,加速AI机器人技术革新

    NVIDIA Isaac机器人平台近期实现重大升级,通过引入最新的生成式AI技术和先进的仿真技术,显著加速了AI机器人技术的发展步伐。该平台正不断扩展其基础模型、机器人学习框架、AI工作流编排以及
    的头像 发表于 03-27 10:36 705次阅读

    机器人学习中主流智能抓取方案

    RGB颜色空间由红绿蓝三种基本色组成,叠加成任意色彩,同样地,任意一种颜色也可以拆解为三种基本色的组合,机器人通过颜色坐标值来理解“颜色”。
    发表于 03-13 10:07 315次阅读
    <b class='flag-5'>机器人学</b>习中主流智能抓取方案

    自主移动机器人(AMR)功能和特点

    复合机器人是一种集成了移动机器人、协作机器人机器视觉等多项功能的新型机器人。它的开发目的是为了解决工厂物流中最后一米的问题,提供智能搬运解
    的头像 发表于 02-28 15:05 2132次阅读
    <b class='flag-5'>自主</b>移动<b class='flag-5'>机器人</b>(AMR)功能和特点