英伟达新技术：机器人就可以模仿,这究竟是一种什么技术？-电子发烧友网

通常机器人在执行任务的时候，我们需要给它输入一串指令，即使是强大的波士顿机器狗也需要通过编程让其学会开门等动作，然而英伟达最近研发出一项新技术，只需要机器人观看人类演示动作，机器人就可以模仿。这究竟是一种什么技术？

工业机器人通常都是一遍又一遍地重复已经编程好的任务，换句话说，执行任务的机器人与编写程序的工程师之间会保持一定的安全距离。然而，越来越多的研究人员都在思考一个问题，如何让机器人与人类的工作环境更加融合，甚至如何让机器人向人类学习。

这也是英伟达在西雅图的新机器人实验室所关注的。据了解，该实验室的研发团队在澳大利亚布里斯班举办的机器人与自动化国际会议（ICRA）上展示了一些他们正在进行的关于机器人教学的研究。

Nvidia展示了一款具有突破性AI机器人，通过观察人类的行为学习完成任务。由Stan Birchfield和Jonathan Tremblay领导的研究人员在他们的研究报告（微信后台回复：英伟达，下载完整论文）中指出：

“通过发出指令让机器人在真实环境中执行任务很容易，这包括输入期望的结果和实现该结果的最佳方式的任何提示。我们研究出了只需通过人为演示，任务以视觉的形式传达给机器人，并提供关于如何最好地执行任务的线索，让机器人来重复人类的动作。”

他们提出了一个可以读取真实世界的人类演示动作的系统，并可以完成推断和执行动作。该系统由一系列神经网络组成，包括执行感知，程序生成和程序执行三部分。即使在严重遮挡的情况下，感知网络也可以使用随机域对合成图像进行训练，可靠地检测实际图像中物体。

在这项研究中，人类主要堆叠不同颜色的立方体，把他堆成垂直或金字塔形状。通过一系列神经网络学习人类可读的程序，由机器人执行以重现演示。

首先，研究人员训练了一系列的神经网络来检测积木，推断积木之间的几何关系，然后生成一个程序让它反复观察人类的每个动作。研究人员称，这个新系统能让他们训练机器人在现实世界中只通过一次演示来就可以完成这个堆叠任务。

为了训练出核心模型，英伟达团队还使用了模拟环境来合成无数的场景数据。Birchfield和Fox强调表示，这些模拟可以快速地训练机器人。毕竟，在现实世界中进行培训需要更长的时间，而且还会出现危险。对于大多数任务来讲，也没有可提前参考的培训数据。

Nvidia的这台机器人由该公司的TITAN X显卡支持，该显卡拥有3584个运行频率为1.5GHz的NVIDIA CUDA内核，整体性能达到11 TFLOPS。

使用TITAN X，研究人员训练了一系列神经网络来执行与感知，程序生成和程序执行相关的职责。从单一的人类演示中，机器人可以开始学着执行任务。

英伟达首席研究科学家斯坦·伯奇菲尔德（Stan Birchfield）表示：“在制造业环境中，机器人非常擅长于反复执行相同的任务，但它们无法适应环境的变化，这导致它们无法学会自己的任务。为了重新设计机器人来执行新任务，你必须让专家对机器人的底层进行重新编程。我们感兴趣的是，让非专家型用户更方便地通过简单演示来教会机器人从事新任务。”

这个系统中存在一系列深度神经网络，用于感知、规划和控制，这些网络使用合成的数据来训练。

伯奇维尔德表示：“目前，机器人领域正在出现范式改变。现在，我们可以使用GPU（图形处理单元）来生成无限量的预加标签数据，用于开发和测试算法。这可能会帮助我们开发与周围世界互动的机器人系统，并且规模更大、更安全。”

英伟达的这项研究发表在本周在澳大利亚布里斯班举行的国际机器人和自动化会议（ICRA）上。

未来，如果这一技术发展成熟，是否可以应用在自动驾驶上，通过观察人类驾驶行为，机器人能够熟练操作方向盘，实现自动驾驶就更进一步。当然这只是作者的想象，或许这一技术有更多其他方面的应用。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4771

浏览量
100752
工业机器人

工业机器人

+关注

关注
91

文章
3363

浏览量
92641
英伟达

英伟达

+关注

关注
22

文章
3775

浏览量
91033

原文标题：英伟达新技术：机器人只需观察人类动作，就能瞬间模仿

文章出处：【微信号：IV_Technology，微信公众号：智车科技】欢迎添加关注！文章转载请注明出处。

国外手术机器人新技术开发情况

成像技术研究所的科研人员开发出一种袖珍腹部手术机器人。其最大尺寸仅6mm。据研制者介绍，该腹部机器人适合做各种腹腔内直视手术，也适合做心血管手术。新开发的手术

发表于 03-01 10:27

浅析机器人技术及其应用

摘要：机器人技术是综合了计算机、控制论、机构学、信息传感技术、人工智能、仿生学等多学科而形成的高新技术，是当代研究十分活跃，应用日益广泛的领域，也是

发表于 09-22 16:39

工业机器人的技术原理

形成的高新技术，是当代研究十分活跃，应用日益广泛的领域。机器人应用情况，是一个国家工业自动化水平的重要标志。　　机器人控制系统是机器人的大脑

发表于 11-23 10:40

图解：IGBT究竟是什么？

图解：IGBT究竟是什么？ IGBT究竟是什么？

发表于 08-10 08:01

电感饱和究竟是什么

电感饱和究竟是什么

发表于 03-11 08:13

分贝究竟是什么？如何去理解它?

分贝究竟是什么？如何去理解它?

发表于 05-31 07:05

一文读懂eMMC究竟是啥？

eMMC究竟是啥？eMMC长什么样？eMMC用在哪？主要是干嘛用的？eMMC究竟是如何工作的呢？

发表于 06-18 06:04

SSD用久了速度会下降，这究竟是为什么呢？

SSD用久了速度会下降，这究竟是为什么呢？造成SSD越用越慢的原因有哪些呢？

发表于 06-18 08:49

spec究竟是什么？有谁可以分享一下吗

spec究竟是什么?哪位同行可以帮忙分享下DFI 5.0的spec?

发表于 06-21 07:16

机器人仿真实验

。机器人主要有两大类：用于制造环境下的工业机器人和用于非制造环境下的服务机器人。工业机器人是一种对生产环境和生产条件

发表于 09-01 06:45

扫地机器人自动回充的技术原理是什么

扫地机器人自动回充，有多种技术原理，有采用雷达定位的、采用蓝牙定位的、红外线定位的。在扫地机器人领域主要是利用这3种定位

发表于 09-14 06:02

增量式编码器倍频技术的M法究竟是怎样测速的

增量式编码器输出的脉冲波形信号形式常见的有哪几种？增量式编码器倍频技术的M法究竟是怎样测速的？

发表于 11-09 07:08

设计一种可用于大学和学校教授机器人技术的机器人

（yaw-roll-roll-yaw-roll-yaw）与市面上大部分机械手机器人使用的相同。在伸展位置，Thor 高约 625 毫米，可以举起高达 750 克的负载。该项目的主要目的是设计一种可用

发表于 07-25 07:04

串口究竟是什么呢？

串口通讯是我们在电力电子设计中使用频率比较高的一种通讯协议，那串口究竟是什么呢？

发表于 04-12 09:40 •2w次阅读

英伟达计划推出驱动人形机器人新技术

英伟达（Nvidia）近日宣布，其用于驱动人形机器人的新技术将于2025年上半年正式上市。这一举措旨在抢占快速增长的

发表于 11-19 17:25 •521次阅读

搜索历史

英伟达新技术：机器人就可以模仿,这究竟是一种什么技术？

评论

国外手术机器人新技术开发情况

浅析机器人技术及其应用

工业机器人的技术原理

图解：IGBT究竟是什么？

电感饱和究竟是什么

分贝究竟是什么？如何去理解它?

一文读懂eMMC究竟是啥？

SSD用久了速度会下降，这究竟是为什么呢？

spec究竟是什么？有谁可以分享一下吗

机器人仿真实验

扫地机器人自动回充的技术原理是什么

增量式编码器倍频技术的M法究竟是怎样测速的

设计一种可用于大学和学校教授机器人技术的机器人

串口究竟是什么呢？

英伟达计划推出驱动人形机器人新技术