0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

借助NVIDIA Project GR00T加速人形机器人开发

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-12-02 13:42 次阅读

人形机器人是机电一体化、控制理论和 AI 交叉领域的一道综合性难题。人形机器人的动力学和控制十分复杂,它们需要先进的工具、技术和算法才能在移动和操作任务中保持平衡。由于人形机器人需要融合复杂的传感器和高分辨率摄像头,才能有效感知环境并推理如何与周围环境进行实时互动,因此另一大难题是机器人数据的采集和各种传感器的集成。此外,为了满足实时处理感知数据和决策所需要的算力,还需要有功能强大的机载计算机。

当前的研究重点仍是开发能够实现机器人自适应行为并促进人与机器人自然交互的技术、工具与机器人基础模型。我们正在积极开展 NVIDIA Project GR00T 研究计划,旨在帮助人形机器人生态系统构建者加快下一代先进机器人的开发工作。本文将讨论用于开发人形机器人的全新 GR00T 工作流,包括:

GR00T-Gen 多样化环境生成工作流

GR00T-Mimic 机器人运动和轨迹生成工作流

GR00T-Dexterity 精细灵巧操作工作流

GR00T-Mobility 移动和导航工作流

GR00T-Control 全身控制(WBC)工作流

GR00T-Perception 多模态感知工作流

GR00T-Gen 多样化环境

生成工作流

GR00T-Gen 是一套在 OpenUSD 中生成机器人任务和仿真就绪环境的工作流,用于训练通用机器人执行操纵、移动和导航。

为了让机器人学习得更“扎实”,需要在具有各种物体和场景的多样化环境中进行训练。但通常情况下,在现实世界中生成大量不同环境既昂贵又耗时,而且大多数开发者还无法使用,因此仿真成为了一个极佳的替代方案。

GR00T-Gen 使用大语言模型(LLM)和 3D 生成式 AI 模型创建并提供以人为本的逼真、多样化环境。它拥有 2500 多个 3D 资产,涵盖了 150 多个物体类别。为了创建视觉多样化场景,在仿真中加入了多种纹理以实现域随机化。域随机化使训练而成的模型和策略在部署到现实世界中时能够有效地泛化。

GR00T-Gen 为移动机械臂和人形机器人提供了跨具身支持并且包含了 100 多种任务,例如开门、按键和导航。

GR00T-Mimic 机器人运动

和轨迹生成工作流

GR00T-Mimic 是一个强大的工作流,它可从远程操作演示中生成用于模仿学习的运动数据。模仿学习是一种训练机器人的方法,机器人通过观察和复制教师演示的动作来掌握技能。该训练过程的一个关键要素是可用演示数据的数量和质量。

人形机器人要想有效、安全地在以人为中心的环境中移动,其“老师”必须是人类示范者,这样才能让机器人通过模仿人类行为来学习。但现有的高质量训练数据十分匮乏,这就带来了巨大的挑战。

为了解决这个问题,需要开发能够捕捉人类行为的大量数据集。生成这种数据的可行方法之一是远程操作,即人类操作员远程控制机器人演示特定任务。虽然远程操作可以生成高保真的演示数据,但在特定时间能够访问这些系统的人数有限。

GR00T-Mimic 旨在扩大数据采集流程的规模。该方法包括在物理世界中使用扩展现实(XR)和空间计算设备(如 Apple Vision Pro)采集数量有限的人类演示。然后利用这些初始演示生成合成运动数据,从而有效地扩大演示数据集。我们的目标是创建一个全面的人类动作库供机器人学习,从而提高它们在真实世界环境中执行任务的能力。

为了进一步支持 GR00T-Mimic,NVIDIA Research 还发布了 SkillMimicGen。这是利用最少的人类演示解决实机操纵任务的第一步。

GR00T-Dexterity 精细灵巧

操作工作流

GR00T-Dexterity 是一套用于精细灵巧操作的模型和策略并包含开发这些模型和策略的参考工作流。

传统的机器人抓取需要集成从识别抓取点到规划运动和控制手指等多个复杂环节。对于有许多执行器的机器人来说,管理这些系统(尤其是使用状态机来处理抓取失败等故障)使端到端抓取成为了一大难题。

GR00T-Dexterity 引入了一个借鉴研究论文 DextrAH-G 的工作流。该工作流是一种基于强化学习(RL)的机器人灵巧性策略开发方法。借助它,可以创建出像素到动作的端到端抓取系统。该系统经过仿真训练后,可部署到物理机器人上。该工作流专为生成能够根据输入的深度数据流进行快速、反应性抓取的策略而设计,并且可以泛化到新物体。

该流程涉及创建一个几何织物定义机器人的运动空间和简化抓取动作,同时针对并行化训练进行优化。通过使用 NVIDIA Isaac Lab,可在多颗 GPU 上使用强化学习训练织物引导的策略,从而泛化抓取行为。最后,通过模仿学习,可利用输入的深度将学习到的策略提炼为适用于现实世界的版本,从而在数小时内制定出稳健的策略。

请注意,GR00T-Dexterity 工作流预览版基于研究论文 DextrAH-G:使用几何织物实现像素到动作的灵巧机械臂-手抓取,并已从 NVIDIA Isaac Gym(已废弃)迁移到 Isaac Lab。如果您是 Isaac Gym 用户,请按照教程和迁移指南开始使用 Isaac Lab。

GR00T-Mobility 移动和

导航工作流

GR00T-Mobility 是一套用于移动和导航的模型和策略并包含开发这些模型和策略的参考工作流。

传统的导航方法在杂乱环境中难以发挥作用并且需要进行大量的调整,而基于学习的方法难以泛化到新的环境。

GR00T-Mobility 引入了一套基于 Isaac Lab 支持的强化学习(RL)和模仿学习(IL)构建的新型工作流,专门用于创建适用于不同环境和具身的通用移动导航方法。

借助使用 NVIDIA Isaac Sim 构建的世界模型,该工作流可生成丰富的环境动态潜在表示,以此实现了更具适应性的训练。它将世界建模与行动策略学习和RL微调分离,从而提高了灵活性,并且由于支持多样化的数据源而具有更高的通用性。

仅在 Isaac Sim 提供的逼真合成数据集上(使用该工作流)训练而成的模型实现了零样本仿真到现实转换,并且可应用于一系列具身,包括差动驱动、Ackermann、四足动物和人形等。

该工作流以 NVIDIA 应用研究团队在 X-MOBILITY:通过世界建模实现端到端可泛化导航中展示的研究成果为基础。

842de9ca-ad87-11ef-93f3-92fbcf53809c.jpg

图 1. 通过使用 Isaac Sim 通过的合成数据集,

GR00T-Mobility 工作流将世界建模和行动策略训练相结合,

实现了可泛化的导航与零样本仿真到现实转换。

GR00T-Control 全身控制工作流

GR00T-Control 是一套用于开发 WBC 的先进运动规划和控制程序库、模型、策略与参考工作流。参考工作流可运用于各种平台、预训练模型和加速程序库。

WBC 对于实现精确、灵敏的人形机器人控制必不可少,尤其是在需要灵巧和移动的任务中。GR00T-Control 引入了一种基于学习的传统模型预测控制(MPC)替代方案,其工作流与 NVIDIA 应用研究团队开发的 Isaac Lab 相集成。这项工作基于 OmniH2O:通用和灵巧人类到人形机器人全身远程操作与学习中展示的原创研究成果以及最新发布的 HOVER:人形机器人多功能中性全身控制器

该参考工作流可帮助开发用于远程操作和自主控制的人形机器人全身控制策略(WBC 策略)。OmniH2O 的远程操作通过 VR 头显、RGB 摄像头、口头命令等输入方法实现了高精度的人类控制。同时,HOVER 的多模态策略提炼框架促进了自主任务模式之间的无缝转换,使其能够适应复杂的任务。

WBC 策略工作流采用仿真到真实学习流程。该流程首先使用 Isaac Lab 作为 能够访问详细运动数据的“教师”模型,通过强化学习在仿真中训练特权控制策略。之后将该模型提炼成可部署的现实世界版本,该版本能够在感官输入有限的情况下运行,解决远程操作延迟、VR 或视觉追踪输入受限(针对 OmniH2O)以及多种自主任务模式的适应性(针对 HOVER)等难题。

(使用 OmniH2O 工作流开发的)全身控制策略提供了 19 个自由度,实现了精确的人形机器人控制。

GR00T-Perception 多模态

感知工作流

GR00T-Perception 是一套先进的感知程序库(例如 nvblox 和 cuVSLAM)、基础模型(例如 FoundationPose 和 RT-DETR)以及基于 Isaac Sim 和 NVIDIA Isaac ROS 构建的参考工作流。这些参考工作流展示了如何在机器人解决方案中结合使用这些平台、预训练模型和加速程序库。

ReMEmbR 是 GR00T-Perception 新增的一项重要功能,是一项应用研究参考工作流。该工作流通过让机器人“记住”长期事件历史增强人机交互,大大改善了个性化和情境感知响应,同时通过集成视觉语言模型、LLM和检索增强记忆大幅提升人形机器人的感知、认知和适应能力。

借助 ReMEmbR,机器人能够长期保留上下文信息,通过整合图像、声音等感官数据提高空间感知、导航和交互效率。该工作流遵循结构化的记忆构建和查询流程,可部署在真实机器人上的 NVIDIA Jetson AGX Orin 上。

想要了解有关 ReMEmbR 的更多信息,请参阅使用生成式 AI 使机器人借助 ReMEmbR 进行推理和行动:

https://developer.nvidia.com/blog/using-generative-ai-to-enable-robots-to-reason-and-act-with-remembr/

8436cc16-ad87-11ef-93f3-92fbcf53809c.png

图 2. ReMEmbR 高级工作流包含两个阶段,

分别是记忆构建阶段和信息查询阶段。

结论

通过 NVIDIA Project GR00T,我们正在构建能够根据人形机器人开发者需求单独或组合使用的先进技术、工具与 GR00T 工作流。这些改进有助于开发智能化水平更高、适应性和能力更强的人形机器人,推动人形机器人在现实世界应用中的发展。

进一步了解领先机器人公司如何使用 NVIDIA 平台,包括 1X、Agility Robotics、The AI Institute、Berkeley Humanoid、波士顿动力、Field AI、傅利叶、银河通用、Mentee Robotics、Skild AI、Swiss-Mile、宇树科技和小鹏机器人。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28265

    浏览量

    206718
  • NVIDIA
    +关注

    关注

    14

    文章

    4952

    浏览量

    102860
  • AI
    AI
    +关注

    关注

    87

    文章

    30348

    浏览量

    268596
  • 人形机器人
    +关注

    关注

    2

    文章

    429

    浏览量

    16509

原文标题:通过 NVIDIA Project GR00T 推进人形机器人视觉和功能开发

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA Isaac 机器人平台利用最新的生成式 AI 和先进的仿真技术,加速 AI 机器人技术的发展

    观众展示了用于人形机器人学习的通用基础模型 Project GR00T(代表通用机器人 00
    的头像 发表于 06-04 18:00 7653次阅读
    <b class='flag-5'>NVIDIA</b> Isaac <b class='flag-5'>机器人</b>平台利用最新的生成式 AI 和先进的仿真技术,<b class='flag-5'>加速</b> AI <b class='flag-5'>机器人</b>技术的发展

    机器人掀起2024开年融资热潮,联想入场投资多家公司,人形机器人要“爆”

    电子发烧友网报道(文/刘静)近日,英伟达在一年一度的GTC大会上重磅推出了人形机器人通用基础模型Project GR00T。相当看好具身智能、人形
    的头像 发表于 03-21 00:34 3663次阅读
    <b class='flag-5'>机器人</b>掀起2024开年融资热潮,联想入场投资多家公司,<b class='flag-5'>人形</b><b class='flag-5'>机器人</b>要“爆”

    透过NVIDIA GR00T模型和Jetson Thor芯片看人形机器人未来发展

    ,具身智能作为行业热词不胫而走,实际上NVIDIA等公司早就在这一领域开始了布局。 具身智能指机器人或智能系统能够通过感知器和执行器与其所处的环境进行实时互动。从概念上说,具身智能的实例范围很广,包括机器人技术、自动驾驶汽车和聊
    的头像 发表于 04-10 00:14 3400次阅读
    透过<b class='flag-5'>NVIDIA</b> <b class='flag-5'>GR00T</b>模型和Jetson Thor芯片看<b class='flag-5'>人形</b><b class='flag-5'>机器人</b>未来发展

    NVIDIA 加速人形机器人发展

    —SIGGRAPH— 当地时间 2024 年 7 月 29 日— 为加速全球人形机器人的发展,NVIDIA 于今日宣布,为全球领先的机器人
    发表于 07-30 09:15 716次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>加速</b><b class='flag-5'>人形</b><b class='flag-5'>机器人</b>发展

    为什么人形机器人更讨人喜欢?

    一般的情绪,并能回应的触摸、语音等指令。有的人形机器人还有“自我”感觉,能感知自己的“身体”等状况。 未来,机器人将成为智能终端的一种高级形态,
    发表于 05-12 09:55

    疯壳人形机器人开发实战全套文档教程(含工具)pdf

    疯壳人形机器人开发实战全套文档教程(含工具)pdf
    发表于 02-25 19:52

    开发教程1】人形街舞机器人-套件检测教程

    多自由度人形双足舞蹈机器人套件检测教程——机器人开发系列配套资料:https://www.fengke.club/GeekMart/su_fV1WzKsGQ.jsp 配套视频:http
    发表于 04-22 14:14

    【教程1】人形街舞机器人-套件检测教程

    多自由度人形双足舞蹈机器人——疯壳·机器人开发系列套件检测教程内容简介本文档主要介绍在如何验证多自由度人形双足街舞
    发表于 08-12 15:55

    英伟达发布人形机器人通用模型与Isaac机器人计划

    作为AI领域的硬件大佬,NVIDIA在推动机器人进步方面一直积极行动。在此次召开的年度GTC开发者大会上,公司对外公布了通过Project GR
    的头像 发表于 03-19 15:57 601次阅读

    NVIDIA发布一款人形机器人通用基础模型—Project GR00T

    NVIDIA 于今日发布人形机器人通用基础模型 Project GR00T,旨在进一步推动其在机器人
    的头像 发表于 03-20 10:00 630次阅读

    英伟达发布人形机器人基础模型

    英伟达在一年一度的GTC开发者大会上,由创始黄仁勋亲自揭晓了令人瞩目的Project GR00T人形
    的头像 发表于 03-21 11:43 734次阅读

    AI机器人迎来多模态模型

    配备 GR00T 模型的机器人由于需要“吸收消化”外界的多模态信息,还要快速完成理解、决策、行动等一系列动作,因此对于算力的需求是巨量的。
    发表于 04-12 10:39 265次阅读

    全球机器人开发领域采用NVIDIA 机器人开发和生产

    比亚迪电子、西门子、泰瑞达和 Alphabet 旗下公司 Intrinsic 采用 NVIDIA Isaac 机器人平台开发自主机械臂、人形机器人
    的头像 发表于 06-03 18:25 1193次阅读

    NVIDIA提供一套服务、模型以及计算平台 加速人形机器人发展

    开发者可以访问新的 NVIDIA NIM 微服务,用于 Isaac Lab 和 Isaac Sim 中的机器人仿真、OSMO 机器人云计算编排服务和远程操作数据捕获工作流等。 为
    的头像 发表于 07-31 10:41 628次阅读

    傅利叶发布新一代人形机器人GR-2

    傅利叶智能科技近日隆重推出了其自主研发的新一代通用人形机器人——GR-2,这款机器人以“为AI打造最佳具身载体”为核心愿景,在硬件、设计及开发
    的头像 发表于 09-27 17:40 775次阅读