英伟达新研究使用合成训练数据进行机器人操纵-电子发烧友网

NVIDIA的研究人员开发了第一个可以教机器人仅通过观察人类的行为来完成任务的深度学习系统。该方法利用合成数据来训练神经网络，是第一次在机器人上使用以图像为中心的域随机化方法。

来自NVIDIA的研究人员开发了一个基于深度学习的系统，该系统可以教机器人仅通过观察人类的行为来完成任务。该方法旨在加强人与机器人之间的交流，同时进一步研究如何使人类无缝地与机器人一起工作。这是第一个这样的系统，研究由Stan Birchfield和Jonathan Tremblay领导。

“要想让机器人在现实世界中执行有用的任务，必须要能很容易地将任务传达给机器人。这包括预期的结果以及任何关于达到该结果的最佳方法的提示。”研究人员在他们的研究报告中指出。“通过演示，用户可以将任务传达给机器人，并向机器人提供如何以最佳的方式执行任务的线索。”

研究人员使用NVIDIA TITAN X GPU训练了一系列神经网络来执行与感知、程序生成和程序执行相关的任务。结果显示，机器人能够通过观察现实世界的单个演示来学习任务。

该方法的工作方式：一个摄像机被用来捕获场景的实时视频流，并且通过两个神经网络实时地对场景中对象的位置和关系进行推断。由此产生的知觉被输入到另一个网络中，该网络生成一个解释如何重建这些感知的计划。最后，一个执行网络读取该计划并为机器人生成动作，同时考虑到当前场景的状态，以确保对外部干扰的稳健性。

一旦机器人得到一个任务，它就会生成一个人类可读取的关于重新执行该任务所需步骤的描述。该描述让用户能够在机器人执行之前快速识别和纠正机器人对人类演示的解释中的问题。

实现这种能力的关键是利用合成数据来训练神经网络。目前训练神经网络的方法需要大量有标记的训练数据，这对这类系统来说是一个瓶颈。通过合成数据生成，不用太费力就可以生成几乎无限的标记训练数据。

这也是第一次在机器人上使用以图像为中心的域随机化方法。域随机化（domain randomization）是一种产生大量多样性的合成数据的技术，然后愚弄感知网络将真实世界的数据看作是其训练数据的另一种变体。研究人员选择以图像为中心的方式处理数据，以确保网络不依赖于摄像机或环境。

研究人员说：“如描述所示，这个感知网络适用于任何固态的现实世界物体，这些物体可以通过其3D边界立方体（bounding cuboid）来模拟。”“尽管训练过程中从未观察到真实的图像，但感知网络能够在真实图像中可靠地检测到物体的bounding cuboid，即使在有严重的遮挡的情况下也是如此。”

在他们的演示中，研究团队用几个彩色积木和一辆玩具汽车训练目标检测器。系统被教授“块”（blocks）的物理关系，不管这些“块”是堆叠在一起还是彼此相邻放置。

在上面的演示视频中，人类操作员向机器人展示了一组立方块。系统然后推断一个适当的程序并按正确的顺序将立方块正确地放置好。因为它在执行过程中会考虑当前世界的状态，因此系统能够实时地从错误中恢复过来。

研究人员将在本周于澳大利亚布里斯班举行的机器人与自动化国际会议（ICRA）上发表他们的研究论文和工作。

该团队表示，他们将继续探索使用合成训练数据进行机器人操纵，以将他们的方法扩展到其他场景。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
211

文章
28423

浏览量
207147
NVIDIA

NVIDIA

+关注

关注
14

文章
4989

浏览量
103077
深度学习

深度学习

+关注

关注
73

文章
5503

浏览量
121178

原文标题：一看就会！英伟达新研究教机器人仅通过观察人类行为完成任务

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

，数据对于训练增强和优化机器人能力的深度学习模型至关重要。从财务上讲，用户数据对互联网公司具有重要价值，估计每个用户 600 美元，考虑到大规模商业化后每个

发表于 12-24 00:33

英伟达计划推出驱动人形机器人新技术

英伟达（Nvidia）近日宣布，其用于驱动人形机器人的新技术将于2025年上半年正式上市。这一举措旨在抢占快速增长的机器人市场，并确立英伟

发表于 11-19 17:25 •524次阅读

英伟达预测机器人领域或迎“GPT-3时刻”

英伟达，作为全球图形处理器与人工智能领域的佼佼者，正引领着科技界对机器人未来的无限遐想。近日，英伟达高级科学家Jim Fan在科技媒体The

发表于 09-20 17:05 •798次阅读

英伟达利用人工智能和Omniverse加速人形机器人开发

8月6日，英伟达揭晓了一项创新工作流程，该流程深度融合了人工智能技术与其Omniverse平台，旨在为人形机器人的研发按下加速键。通过巧妙结合苹果Vision Pro的先进功能与英伟

发表于 08-06 17:29 •720次阅读

英伟达打造人形机器人训练平台，引领AI新纪元

英伟达近日宣布了一项重大举措，为全球机器人制造业与AI领域注入强劲动力。公司推出了专为人形机器人设计的训练平台，旨在为行业领先的制造商、AI

发表于 08-05 11:45 •739次阅读

阿尔特携手英伟达,将Omniverse融入机器人研发

　近日，阿尔特公司在其机构调研活动中透露，公司正携手英伟达技术团队，将Omniverse平台深度融入机器人研发领域，旨在打通英伟达全面的

发表于 07-25 12:40 •732次阅读

Al大模型机器人

理解能力强大: AI大模型机器人可以理解和生成自然语言，能够进行复杂的对话和语言任务。它们能够识别语言中的语义、语境和情感，并据此作出适当的回应。广泛的知识储备: 这些模型基于大规模的数据集进

发表于 07-05 08:52

人形机器人的未来:从英伟达到特斯拉的机器人革命

在科技飞速发展的今天，机器人技术正逐步从科幻走向现实。近日，英伟达CEO黄仁勋在一次采访中大胆预测，机器人技术将在未来2-3年内取得重大突破，并预言人形

发表于 06-18 14:56 •540次阅读

英伟达CEO黄仁勋展望AI与机器人新时代

在COMPUTEX 2024大会上，英伟达CEO黄仁勋发表了激动人心的演讲，他看好机器人即将跨入拥有更强感知能力和系统的全新时代。黄仁勋强调了自家人工智能（AI）Omniverse技术在这一领域的巨大潜力，该技术将助力

发表于 06-03 11:30 •758次阅读

英伟达发布人形机器人基础模型

英伟达在一年一度的GTC开发者大会上，由创始人黄仁勋亲自揭晓了令人瞩目的Project GR00T人形机器人项目，其中引人注目的是一款全新的人形机器

发表于 03-21 11:43 •767次阅读

英伟达GTC大会丨宇树通用人形机器人H1与全球共同拥抱AI

2024年3月19日，英伟达CEO黄仁勋在美国加州圣何塞SAP中心发表主题演讲《见证AI的变革时刻》，正式拉开了2024年英伟达GTC大会的序幕。宇树（Unitree）通用人形

发表于 03-20 14:55 •647次阅读

人形机器人火热　OpenAI入局人形机器人 英伟达等巨头入局机器人行业

人形机器人火热 OpenAI入局人形机器人 英伟达等巨头入局机器人行业人形机器人在AI的带动下

发表于 02-26 17:21 •800次阅读

英伟达、微软、OpenAI纷纷下注人形机器人初创公司FigureAI

2024年初，机器人领域迎来了一场科技巨头的投资热潮。英伟达、微软、OpenAI和亚马逊创始人贝索斯等重量级玩家纷纷向初创公司FigureAI注资，总额高达6.75亿美元。这一动作不仅

发表于 02-26 11:27 •943次阅读

人形机器人爆发前夜？英伟达和OpenAI等巨头纷纷押注

新近消息显示，一家开发类人机器人的初创公司新近融资云集包括英伟达和OpenAI在内的硅谷大厂和风投基金，显示类人机器人正在成为科技巨头押注人工智能（AI）应用的新风口。

发表于 02-26 09:36 •1090次阅读

英伟达推出全新AI聊天机器人

近日，英伟达（Nvidia）宣布推出其全新的AI聊天机器人——“Chat With RTX”。这款聊天机器人被视为英伟

发表于 02-19 11:09 •924次阅读

搜索历史

英伟达新研究使用合成训练数据进行机器人操纵

评论

【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

英伟达计划推出驱动人形机器人新技术

英伟达预测机器人领域或迎“GPT-3时刻”

英伟达利用人工智能和Omniverse加速人形机器人开发

英伟达打造人形机器人训练平台，引领AI新纪元

阿尔特携手英伟达,将Omniverse融入机器人研发

Al大模型机器人

人形机器人的未来:从英伟达到特斯拉的机器人革命

英伟达CEO黄仁勋展望AI与机器人新时代

英伟达发布人形机器人基础模型

英伟达GTC大会丨宇树通用人形机器人H1与全球共同拥抱AI

人形机器人火热　OpenAI入局人形机器人英伟达等巨头入局机器人行业

英伟达、微软、OpenAI纷纷下注人形机器人初创公司FigureAI

人形机器人爆发前夜？英伟达和OpenAI等巨头纷纷押注

英伟达推出全新AI聊天机器人