0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA发布全新AI和仿真工具以及工作流

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-11-09 11:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

新的 Project GR00T 工作流和 AI world model开发技术将提高机器人的灵巧性、控制性、操纵性和移动性。

NVIDIA 在本周于德国慕尼黑举行的机器人学习大会(CoRL)上发布了全新 AI 和仿真工具以及工作流。机器人开发者可以使用这些工具和工作流,大大加快 AI 机器人(包括人形机器人)的开发工作。

此次发布的系列产品包括:NVIDIA Isaac Lab 机器人学习框架正式版;Project GR00T(一个为加速人形机器人发展的项目)的六个全新人形机器人学习工作流;以及用于视频数据管理和处理的全新世界模型开发工具,包括用于视频处理的NVIDIA Cosmos tokenizer和NVIDIA NeMo Curator。

开源 Cosmos tokenizer可将图像和视频分解为具有极高压缩率的高质量 token,为机器人开发者提供卓越的视觉标记化功能。Cosmos tokenizer的运行速度最高可达到当前标记器的 12 倍,NeMo Curator 的视频处理整理速度则最高可达到未优化管线的 7 倍。

NVIDIA 在 CoRL 上还发布了 23 篇与机器人学习相关的论文,并举办了 9 场研讨会,同时发布了面向开发者的培训和工作流指南。此外,Hugging Face 和 NVIDIA 还宣布,将共同使用 LeRobot、NVIDIA Isaac Lab和NVIDIA Jetson来加速开发者社区的开源机器人研究。

使用 Isaac Lab 加速机器人开发

NVIDIA Isaac Lab 是一个建立在NVIDIA Omniverse平台上的开源机器人学习框架。NVIDIA Omniverse 是一个用于开发适用于工业数字化和物理 AI 仿真的 OpenUSD 应用的平台。

开发者可以使用 Isaac Lab 来大规模训练机器人策略。这个开源的统一机器人学习框架适用于从人形机器人到四足机器人和协作机器人等各种具身,能够处理日益复杂的动作和交互。

全球领先的商用机器人制造商、机器人应用开发商和机器人研究机构都在使用 Isaac Lab,包括 1X、Agility Robotics、波士顿动力人工智能研究所、Berkeley Humanoid、波士顿动力公司、Field AI、傅利叶、银河通用、Mentee Robotics、Skild AI、Swiss-Mile、宇树科技和小鹏机器人。

Project GR00T:

通用人形机器人的基础

制造先进的人形机器人非常困难,需要多层技术和跨学科方法,才能使机器人有效地感知、移动和学习技能,进而实现人与机器人以及机器人与环境的交互。

Project GR00T旨在通过开发加速库、基础模型和数据管线,加速全球人形机器人开发者生态的发展。

这六个全新 Project GR00T 工作流为人形机器人开发者提供了实现最具挑战性的人形机器人功能的蓝图:

GR00T-Gen用于构建基于 OpenUSD 的生成式 AI 3D 环境

GR00T-Mimic用于生成机器人运动和轨迹

GR00T-Dexterity用于机器人灵巧操作

GR00T-Control用于全身控制

GR00T-Mobility用于机器人运动和导航

GR00T-Perception用于多模态感知

NVIDIA 具身 AI 高级研究经理 Jim Fan 表示:“人形机器人是具身 AI 的下一轮浪潮。NVIDIA 的研究和工程团队正在与整个公司内部和我们的开发者生态合作构建 Project GR00T,以帮助推动全球人形机器人开发者的进步和发展。”

世界模型构建者的新开发工具

如今,机器人开发者正在构建世界模型。这种用 AI 呈现世界的方式可以预测物体和环境对机器人行动的反应。构建这些世界模型需要大量计算和数据,这些模型需要数千小时的经过整理的真实世界图像或视频数据。

NVIDIA Cosmos tokenizer 提供高效、优质的编码和解码能力,能够简化这些世界模型的开发。它们树立了最小失真和时间不稳定性的新标准,实现了高质量的视频和图像重建。

Cosmos tokenizer 提供了高质量压缩和最高达 12 倍的视觉重构速度,为在广泛的视觉域开发可扩展、强大且高效的生成应用创造了条件。

人形机器人公司 1X 已更新了 1X 世界模型挑战赛数据集,以便使用 Cosmos tokenizer。

1X Technologies AI 副总裁 Eric Jang 表示:“NVIDIA Cosmos tokenizer 在保持视觉保真度的同时,实现了对我们数据的高度时空压缩。这让我们能够以更高效的计算方式,来使用长视距视频生成技术去训练世界模型。”

包括小鹏机器人和 Hillbot 在内的其他人形机器人和通用机器人开发商正在其开发过程中使用 NVIDIA Cosmos tokenizer,以管理高分辨率图像和视频。

NeMo Curator 现在加入了一个视频处理管线,这使机器人开发者能够通过处理大规模文本、图像和视频数据,来提高其世界模型的准确性。

由于视频数据的规模庞大,需要可扩展的管线和跨 GPU 负载平衡的高效编排,这给视频数据管理带来了挑战。此外,还需要对过滤、字幕生成和嵌入模型进行优化,才能最大程度地提高吞吐量。

NeMo Curator 通过自动管线编排来简化数据整理工作,显著缩短了处理时间,从而克服了这些挑战。NeMo Curator 支持跨多节点、多 GPU 系统的线性扩展,可高效处理 100 PB 以上的数据,这简化了 AI 开发,降低了成本,加快了产品的上市时间。

在 CoRL 上

推进机器人学习社区的发展

NVIDIA 机器人团队与 CoRL 共同发布的近二十篇研究论文涵盖了以下领域的突破性成果:集成 VLM 来优化环境理解和任务执行、机器人时间导航、为复杂的多步骤任务制定长视距规划策略,以及利用人类演示来习得技能。

有关人形机器人控制和合成数据生成的突破性论文包括:SkillGen(一个基于合成数据生成的系统,用于在人工演示极少的情况下训练机器人)和 HOVER(一个用于控制人形机器人运动和操作的机器人基础模型)。

NVIDIA 研究人员还参加了本届大会的九场研讨会。进一步了解有关活动的完整日程安排:

供货情况

NVIDIA Isaac Lab 1.2 现已在 GitHub 上开源可用。NVIDIA Cosmos tokenizer现已在 GitHub 和 Hugging Face 上开源。用于视频处理的 NeMo Curator 将于本月底发布。

新的 NVIDIA Project GR00T 工作流即将推出,以帮助机器人公司更加轻松地构建人形机器人功能。

学习使用 Isaac Lab 的研究人员和开发者现可以访问开发者指南和教程,包括 Isaac Gym 到 Isaac Lab 的迁移指南。

在即将于 11 月 13 日举行的关于机器人仿真和学习的 OpenUSD 内部直播中了解机器人学习和仿真的最新进展.。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    214

    文章

    31611

    浏览量

    224319
  • NVIDIA
    +关注

    关注

    14

    文章

    5721

    浏览量

    110230
  • 仿真
    +关注

    关注

    55

    文章

    4560

    浏览量

    138801

原文标题:NVIDIA 利用 AI 和仿真工具推动机器人学习和人形机器人开发

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    扣子AI智能体工作流(完结)

    的核心诉求。然而传统开发模式的高技术门槛、长交付周期和昂贵成本,将多数非技术部门拒之门外。扣子工作流的出现,彻底打破了这种技术垄断,通过可视化、模块化的设计理念,让业务人员首次真正掌握了自动化工具的开发权,开启了"人人都是开发者"的新纪元。 一、技术民主化:从代码编程到逻
    的头像 发表于 04-25 11:21 414次阅读

    工作流节点说明---工作流节点

    平台提供工作流节点,实现工作流嵌套工作流的效果。 节点说明 在一个工作流中,开发者可以将另一个工作流作为其中的一个步骤或节点,实现复杂任务
    发表于 03-24 21:05

    工作流插件节点节点说明

    插件节点用于在工作流中调用插件运行指定工具。 插件是一系列工具的集合,每个工具都是一个可调用的API。插件广场上架的插件或已上架的团队插件支持以节点形式被集成到
    发表于 03-23 16:54

    NVIDIA发布面向媒体工作流AI技术

    在 GTC 2026上,NVIDIA 宣布了多项强大的新技术,旨在变革直播媒体和后期制作工作流
    的头像 发表于 03-23 15:15 539次阅读

    NVIDIA发布Vera Rubin DSX AI Factory参考设计

    NVIDIA 今日宣布推出 NVIDIA Vera Rubin DSX AI Factory 参考设计,这是一份用于构建协同设计的 AI 基础设施的指南。同时正式
    的头像 发表于 03-18 14:42 720次阅读

    工作流节点说明结束节点

    结束节点是工作流的最终节点,用于返回工作流运行后的结果。结束节点支持两种返回方式:返回变量、返回文本。 返回变量 在返回变量模式下,工作流运行结束后会以JSON格式输出所有返回参数,适用于工作
    发表于 03-16 16:43

    全新NVIDIA Nemotron 3 Super模型重磅发布

    一款全新的开放 1,200 亿参数混合式 MoE (mixture‑of‑experts) 模型,专为 NVIDIA Blackwell 进行了优化,可解决拖慢自主智能体工作流的长时推理和上下文爆炸的成本难题。
    的头像 发表于 03-16 16:22 618次阅读

    NVIDIA和ComfyUI携手简化本地AI视频生成工作流

    借助 ComfyUI 的应用视图、NVIDIA RTX Video 超分辨率和全新的 NVFP4 模型,AI 驱动的视频生成更加易用。
    的头像 发表于 03-14 16:37 2601次阅读
    <b class='flag-5'>NVIDIA</b>和ComfyUI携手简化本地<b class='flag-5'>AI</b>视频生成<b class='flag-5'>工作流</b>

    工作流节点说明开始节点

    开始节点是工作流的起始节点,用于设定启动工作流需要的输入信息。开始节点只有输入参数,没有输出等其他参数。开始节点中默认有一个输入参数USER_INPUT,一个默认的输入参数FILES_INPUT(非
    发表于 03-13 14:52

    开发工作流创建工作流

    绿色,用户可在页面右侧弹窗中查看节点的输入输出以及运行的调测树信息。 2、单击【上架】,调测成功的工作流方可发布上架。 本问参考鸿蒙官方文档
    发表于 03-10 10:05

    利用NVIDIA Nemotron开放模型构建智能文档处理系统

    基于 NVIDIA Nemotron 开放模型的 AI 驱动文档智能,增强科学研究、金融和法律等领域工作流
    的头像 发表于 02-25 11:21 766次阅读

    NVIDIA在CES 2026发布全新开放模型、数据和工具

    为扩展开放模型生态,NVIDIA 发布全新开放模型、数据和工具,推动各行业 AI 技术的发展。
    的头像 发表于 01-09 10:42 816次阅读

    全新软件与模型优化为NVIDIA DGX Spark注入强大动力

    发布以来,NVIDIA 通过持续的软件优化以及与软件合作伙伴和开源社区的紧密协作,不断提升基于 Grace Blackwell 架构的 DGX Spark 的性能。这些举措在推理、训练和创意
    的头像 发表于 01-09 10:17 960次阅读

    摩尔线程发布SimuMax v1.1:从仿真工具升级为全栈工作流平台,助力大模型训练提效

        近日,摩尔线程正式发布开源大模型分布式训练仿真工具SimuMax的1.1版本。该版本在完整继承v1.0高精度仿真能力的基础上,实现了从单一
    的头像 发表于 01-09 09:17 399次阅读
    摩尔线程<b class='flag-5'>发布</b>SimuMax v1.1:从<b class='flag-5'>仿真</b><b class='flag-5'>工具</b>升级为全栈<b class='flag-5'>工作流</b>平台,助力大模型训练提效

    使用OpenUSD与NVIDIA Halos构建安全物理AI系统

    如何使用 OpenUSD 和 NVIDIA Omniverse 的最新进展深入改变他们的工作流。 物理 AI 正从研究实验室走向现实世界,为智能机器人和智能汽车 (如无人驾驶出租车) 提供支持,这些系统必须在不可预测
    的头像 发表于 12-24 10:22 1078次阅读