0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

美国陆军研发了一种高效的地面机器人学习模型

姚小熊27 来源:人工智能实验室 作者:人工智能实验室 2021-01-06 09:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

美国陆军面向未来多域作战概念研发了一种高效的地面机器人学习模型,该模型提出基于强化学习的策略,可有效减少当前训练强化学习策略的不可预测性,使自主智能体能够推理并适应不断变化的战场条件。

强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。强化学习技术具备解决复杂问题的能力,近年来在如围棋、象棋和电子游戏等领域有较为长足的发展。美国陆军将这种强化学习技术应用在地面机器人面临着两个巨大挑战。首先是算法的限制。在强化学习中,策略梯度方法(Policy Gradient Methods)是连续空间可伸缩算法的基础,但是现有技术无法支持更广泛的决策目标,例如风险敏感性、安全约束、对先验知识的探索和发散。其次就是数据量的问题。强化学习需要大量的样本复杂性,而美国陆军多域作战概念和下一代战斗车辆(NGCV)项目目前数据匮乏并不支持现有训练机制。

在陆军多域作战概念和NGCV项目中应用强化学习,训练机制必须提高连续空间中的样本效率和可靠性,ARL通过将现有的策略搜索方案推广到通用工具,取得了重要突破。研究人员为通用程序开发了新的策略搜索方案,并且还确定了其样本复杂度。由此产生的策略搜索方案减少了奖励积累的波动性,形成了对未知领域的有效探索和先验的机制。值得注意的是,地面机器人获取数据的成本很高。减少奖励积累的波动性,确保以有效的方式探索未知领域,或者吸收以前的经验,都将有助于打破强化学习中现行实践的样本效率壁垒。通过减少随机抽样的数量,可以实现策略优化。

这项研究为强化学习中的经典策略梯度定理做出了贡献。装备有强化学习功能的自主机器人将能够协助战士在未来战场上进行侦察探索和风险评估。研究人员下一步计划在强化学习中将更广泛的决策目标纳入多主体设置,并研究强化学习主体之间的交互设置如何在团队之间产生协同和对抗性推理。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    214

    文章

    31602

    浏览量

    224273
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    大象机器人myCobot 320机械臂如何凭实力走进顶尖学府

    在复旦大学邯郸校区某栋实验楼里,堂关于《机器人学导论》的课程刚刚结束。学生们没有急着离开,而是围在实验台前,对着桌面上台精巧的白色机械臂,热烈地讨论着刚刚跑通的抓取算法。
    的头像 发表于 03-20 09:43 357次阅读

    基于NVIDIA Isaac Lab拓展多模态机器人学习

    构建强大的智能机器人需要在复杂环境中进行测试。然而,在现实世界中收集数据不仅成本高昂、耗时漫长,还常常伴随高风险。针对关键危险场景(例如高速碰撞或硬件故障)进行安全训练几乎是不可能的。更严重的是,现实世界的数据往往偏向“正常”运行条件,导致机器人在面对突发状况时缺乏应对能
    的头像 发表于 03-09 16:26 1045次阅读
    基于NVIDIA Isaac Lab拓展多模态<b class='flag-5'>机器人学习</b>

    NVIDIA神经网络创新研究重塑机器人学习

    目前,机器人在受控的环境中能够有出色的表现,但在面对现实世界任务时,仍难以应对其中的不可预测性、操作灵活性和细微的交互需求,例如组装精密组件或是以接近人类的精度操控日常物体。
    的头像 发表于 10-21 11:07 2236次阅读
    NVIDIA神经网络创新研究重塑<b class='flag-5'>机器人学习</b>

    NVIDIA Isaac Lab 2.3新增功能助力简化机器人学习

    基于真实世界演示训练机器人策略,不仅成本高、速度慢,还容易出现过拟合问题,进而限制其在不同任务与环境中的泛化能力。而仿真优先的方法可简化开发流程、降低风险与成本,同时部署到真实环境也将更安全、适应性更强。
    的头像 发表于 10-21 10:50 1369次阅读

    NVIDIA开源物理引擎与OpenUSD加速机器人学习

    开发能在工厂、医院和公共空间与人类协同作业的机器人项巨大的技术挑战。这类机器人需具备与人类接近的灵巧性、感知能力、认知能力和全身协调性,以便于实时应对充满不确定性的真实环境。
    的头像 发表于 10-13 11:15 1284次阅读

    NVIDIA 发布三大利器,推动人形机器人迈向新纪元

    电子发烧友网综合报道 在节前的机器人学习大会(CoRL)上,NVIDIA 发布了系列突破性技术,包括开源物理引擎 Newton、机器人基础模型 Isaac GROOT N1.6以及全
    的头像 发表于 10-13 04:42 6088次阅读

    英伟达发布机器人 “新大脑”,黄仁勋:人形机器人三年普及

    完成如 “烤面包” 这样的复杂任务。结合 Omniverse 仿真平台,训练效率提高了10倍,大大缩短了机器人学习和适应现实环境的时间。 英伟达创始人兼首席执行官黄仁勋在链博会上发表演讲时指出,物理 AI 将推动 AI 从虚拟世界迈向实体领域,重构工业和日常生活
    的头像 发表于 08-25 18:34 573次阅读

    地平线H-RDT模型斩获CVPR 2025大赛冠军

    近日,在计算机视觉与模式识别领域顶级会议CVPR 2025举办的RoboTwin双臂机器人竞赛中,地平线机器人实验室与清华大学计算机系朱军团队联合提出的H-RDT凭强大性能和领先成功率,举斩获真机赛冠军(
    的头像 发表于 08-21 10:02 847次阅读
    地平线H-RDT<b class='flag-5'>模型</b>斩获CVPR 2025大赛冠军

    易控智驾与中科院端到端自动驾驶方案入选CoRL 2025

    近日,旨在分享和探讨机器人技术与机器学习交叉领域最新进展的国际顶级机器人学习会议CoRL 2025 (Conference on Robot Learning)论文接收结果揭晓。
    的头像 发表于 08-18 14:43 2589次阅读
    易控智驾与中科院端到端自动驾驶方案入选CoRL 2025

    NVIDIA展示机器人领域的研究成果

    在今年的机器人科学与系统会议 (RSS) 上,NVIDIA 研究中心展示了系列推动机器人学习的研究成果,展示了在仿真、现实世界迁移和决策制定领域的突破。
    的头像 发表于 07-23 10:43 1741次阅读

    NVIDIA Isaac Lab可用环境与强化学习脚本使用指南

    Lab 是个适用于机器人学习的开源模块化框架,其模块化高保真仿真适用于各种训练环境,Isaac Lab 同时支持模仿学习(模仿人类)和强化学习(在尝试和错误中进行
    的头像 发表于 07-14 15:29 2764次阅读
    NVIDIA Isaac Lab可用环境与强化<b class='flag-5'>学习</b>脚本使用指南

    通过NVIDIA Cosmos模型增强机器人学习

    通用机器人的时代已经到来,这得益于机械电子技术和机器人 AI 基础模型的进步。但目前机器人技术的发展仍面临个关键挑战:
    的头像 发表于 07-14 11:49 1383次阅读
    通过NVIDIA Cosmos<b class='flag-5'>模型</b>增强<b class='flag-5'>机器人学习</b>

    NVIDIA Isaac Sim和Isaac Lab现已推出早期开发者预览版

    NVIDIA 发布了机器人仿真参考应用 Isaac Sim 和机器人学习框架 Isaac Lab 的开发者预览版。开发者现在可以通过 GitHub 访问早期版本,抢先体验先进功能,用于在基于物理的仿真环境中构建、训练和测试 AI 驱动的
    的头像 发表于 07-04 14:23 2141次阅读

    轮式移动机器人电机驱动系统的研究与开发

    系统,开发了套二轮差速驱动转向移动机器人电机驱动系统,完成了系统各部件的整体装配和调试。试验结果表明,该设计方案可行、系统运行稳定可靠、成本低廉、所用元件易于购置,具有较好的实用的价值和应用前景。 纯
    发表于 06-11 14:30

    NVIDIA Isaac Sim与NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了机器人仿真参考应用 NVIDIA Isaac Sim 和机器人学习框架 NVIDIA Isaac Lab 的更新,以加速各种形态机器人的开发。
    的头像 发表于 05-28 10:06 2505次阅读