让机器人通过一段只有一个人的视频来模仿学习-电子发烧友网

人类和动物在学习新行为时，大部分只需要观察一次就能学会，然而想让机器人学习就没那么容易了。随着计算机视觉的发展，目前的技术能让机器人依靠人体姿势检测系统，模仿人类的动作进行学习。不过每次都需要人类“做示范”未免有些麻烦，本篇论文的研究人员们想出了新方法：让机器人通过一段只有一个人的视频来模仿学习。

此前的研究表明，机器人能通过观察示范学习一系列复杂的技能，例如倒水、打乒乓球、打开抽屉等。然而，机器人模仿最有效的方法与人类学习有很大的不同：机器人通常需要接到具体的动作示范或遥控操作，人类只需看别人做一遍就能了解。另外，人类还能根据环境变化改变策略，适应新情况。所以，我们怎样能让机器人像人类一样，通过观察第三方示范进行学习？

从原始视频中获得技能存在两大挑战。首先，人类演示者和机器人的外观及形态的差异会带来系统性的域转移（domain shift），即对应问题（correspondence problem）。其次，从原始视觉输入中学习通常需要大量数据，深度学习视觉系统一般要使用数十万至数百万的图像。而在本文中，我们展示了通过基于元学习的单一方法解决这两个挑战。

前期准备

该方法建立在之前的工作成果或者元学习的基础上，我们将对模型元学习算法进行扩展，它能够处理提供的数据（即人类演示）和评估设置（即机器人动作）之间的域转移。

元学习算法能快速有效地学习新任务，一般来说，元学习可以看作是发现任务之间存在的结构的功能。当模型从元测试集中提出新任务时，模型可以使用已知结构快速学习。算法（MAML）通过对深度网络的初始参数设置进行优化来实现这一点。在元训练之后，根据新任务的数据对学习参数进行微调。

模仿人类

在这一部分，我们将说明机器人一次性模仿人类学习的问题，并介绍我们的试验方法。从含有人类的视频中进行学习可以看做是一个推理问题，其目标是推断机器人的策略参数，它能将先验知识与少量证据结合来完成任务。为了从只有一个人的视频中有效学习，我们需要包含着对世界有着丰富视觉和物体理解的先验知识。

而试验方法包括两个阶段，在元训练阶段，我们需要利用人类和机器人的动作数据获取先验知识，然后通过快速学习模仿动作。这一方法的关键部分在于，它可以迁移到其他元学习算法中去。如MAML算法一样，我们将学习一系列初始参数，在经历过几次梯度下降后，模型还能有效地完成新任务。最终用于元目标的算法可以总结为：

让机器人通过一段只有一个人的视频来模仿学习

在元训练阶段之后，学习到的先验知识将用于第二阶段。当机器人模仿人类的新动作时，必须将先验知识与新的人类示范动作结合，来推断解决新任务的策略参数。算法总结为：

让机器人通过一段只有一个人的视频来模仿学习

时序适应目标学习

为了从人的视频中学习，我们需要一个适应目标，可以有效地捕捉视频中的相关信息，比如人的意图和与任务有关的对象。由于时序卷积在处理时序和数据序列时是有用的，所以我们选择用一个卷积网络表示适应目标。效果如图所示：

让机器人通过一段只有一个人的视频来模仿学习

网络架构

让机器人通过一段只有一个人的视频来模仿学习

如图所示，网络架构是一个卷积神经网络，将RGB图像映射到动作分布。卷积网络从几个卷积层开始，然后被输送到通道空间的argmax中，为每个通道提取二维特征点f。接着我们将这些特征点与机器人结构连接在一起，该结构包括夹具上的3个非轴对齐的点。然后，我们将连接的特征点和机器人姿态传递给多个完全连接层。

实验过程

我们的实验主要想解决三个问题：

我们的方法能否有效地学习先验知识，让机器人能够通过仅有一人的视频学习操作新物体？

我们的方法能否从新的角度让机器人模仿人类动作？

我们所提出的方法与元学习方法以及其他方法有何不同？

为了进一步了解我们的方法以及其实用性，我们还要另外评估：

时序适应目标有多重要？

我们的方法能否用于多个机器人平台，以及用于动作或遥控示范的元训练？

为了进行评估，我们在7轴的PR2机械臂和Sawyer机器人上进行实验。

PR2实验过程

首先是用机械臂PR2进行物体的放置、前推、捡拾等动作的测试，具体过程如图：

从左至右分别是：物体放置、推动以及捡拾-放下动作。上面一排是人类示范

整个过程的装置情况是这样的：

用于拍摄的是一台智能手机，从中看到的情况是这样的：

最后，PR2一次学习的评估情况展示在下表中，可以看到成功率大大高于之前的方法：

让机器人通过一段只有一个人的视频来模仿学习

另外，研究人员还统计了PR2在做“推动”时发生的错误：

让机器人通过一段只有一个人的视频来模仿学习

Sawyer实验过程

实验的另一个目标是我们的方法能否应用于别的平台上，于是我们选择了7个自由度的Sawyer进行验证。不同与PR2实验，动作空间将是末端执行器的单个指令姿态，我们将使用均方误差作为外部的元目标。

让机器人通过一段只有一个人的视频来模仿学习

最终，在使用时序适应目标的实验中，成功率比没有使用的提高了14%，证明了从视频中学习时融合时间信息的重要性。

实验的局限性

虽然我们的工作成果能让机器人从视频中一次性学习操作新的物体，但是目前的实验还没有证明模型能够一次性学习全新动作。希望未来有更多的数据和更高性能的模型能实现这一目标。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
211

文章
28379

浏览量
206899
深度学习

深度学习

+关注

关注
73

文章
5500

浏览量
121105

原文标题：利用自适应域的元学习让机器人一次学会人类动作

文章出处：【微信号：jqr_AI，微信公众号：论智】欢迎添加关注！文章转载请注明出处。

一个人的奋斗历程

一个人的奋斗历程

发表于 06-24 19:39

机器人的理想

本帖最后由 86hupeng 于 2012-12-2 09:10 编辑　　机器人是一个群体，也是一个目标，更是

发表于 10-16 18:33

【卡酷机器人】——面向儿童教育

，可以搭配任意传感器、电子积木来实现卡酷机器人的N多种玩法，学习机器人控制的原理、计算机编程、电子设计等等，极具趣味性和学习性，让中国的

发表于 01-13 10:41

家用服务机器人将成为机器人的下一个入口

程序设定好之后就能让机械臂按照指定的动作来高效完成一些简单重复性的事情，这么一来既可节省工期还能高效不易出错。可谓是工厂流水线操作的好帮手。而家用服务机器人的出现，

发表于 08-10 18:16

邯郸学舞机器人

通过视觉传感器获取互动表演者的手臂姿态，挥动双手臂模仿表演者的动作，实现对机器人的仿生模拟控制。邯郸学舞机器人由一

发表于 03-28 11:42

为什么人形机器人更讨人喜欢？

。相比之下，人形机器人（又称“仿人机器人”或“类人机器人”）比那些非人形机器人更讨人喜欢。从心理层面讲，人形机器人是最容易

发表于 05-12 09:55

人类与机器人有感情产生吗？

`　　之前看到周润发的一部电影里面的一个机器人，让我对机器人有了新的看法。里面的那个

发表于 11-10 10:18

ai智能外呼机器人引领时代浪潮

、福利、假期等的必备需求，新入职的员工还需要很长时间的适应学习，所有的一切无不透露出传统电销商业模式的弊端，很大程度上制约着企业的发展。而随着人工智能的不断落地，越来越多的企业也开始选择电销机器人

发表于 06-15 10:34

机器人、协作机器人和移动机器人，你分的清楚吗

的机器人，人与机器人之间可能会发生身体接触。有人反对协作机器人这一说法，认为没有这种机器人，

发表于 10-30 11:33

机器人技术和机器学习

机器人技术和机器学习正成为嵌入式系统硬件和软件供应商的下一个重大事件。嵌入式系统可以通过网络连接和物联网（IoT）

发表于 12-20 06:03

机器人是什么？

的机器。一些书呆子式的语言可能会把它描述成“一个可重新编程的多功能机械手，旨在通过各种编程的动作移动材料、部件、工具或专门设备，以完成各种任

发表于 03-31 10:31

制作一个教育机器人

教师想要的教学内容？你的学生。任何想开始学习教育机器人的人都可以组装、编程和使用它。这是一个非常小的印刷电路板？它只安装两个眼睛模式的LED

发表于 08-19 07:25

让机器人通过观察人类的操作来学会操作新的物体

为了让机器人可以从视频中学习，研究人员将模仿学习与一

发表于 07-03 14:33 •3234次阅读

震惊！AI竟可通过照片来判断一个人是否是同性恋

斯坦福大学的两位研究员发布了一个研究报告，他们用数十万张约会网站的照片来训练一个面部识别系统，尝试让

发表于 08-08 17:34 •5433次阅读

多家机器人企业布局“机器人造机器人”产线

从特斯拉展示的关于人形机器人擎天柱的视频来看，与去年视频相比，该视频中的机器人似乎更加灵活，能够行走。但不同于以往仅有

发表于 05-05 10:43 •1337次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

让机器人通过一段只有一个人的视频来模仿学习

评论

一个人的奋斗历程

机器人的理想

【卡酷机器人】——面向儿童教育

家用服务机器人将成为机器人的下一个入口

邯郸学舞机器人

为什么人形机器人更讨人喜欢？

人类与机器人有感情产生吗？

ai智能外呼机器人引领时代浪潮

机器人、协作机器人和移动机器人，你分的清楚吗

机器人技术和机器学习

机器人是什么？

制作一个教育机器人

让机器人通过观察人类的操作来学会操作新的物体

震惊！AI竟可通过照片来判断一个人是否是同性恋

多家机器人企业布局“机器人造机器人”产线