0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

四足机器人走着走着突然断了一条腿,还能继续前进吗?

天津机器人 来源:QbitAI 2023-08-08 15:40 次阅读

四足机器人走着走着突然断了一条腿,还能继续前进吗?

来自谷歌和密歇根大学的最新成果,给出了非常肯定的答案。

bd3c230e-3537-11ee-9e74-dac502259ad0.jpg

他们发明的一种叫做AutoRobotics-Zero (ARZ)的搜索算法,既不靠大模型,也不用神经网络,可以让机器人一旦遇到剧烈的环境变化,就立刻自动更改行动策略。

譬如断腿照样走:

bd81c0d0-3537-11ee-9e74-dac502259ad0.gif

相比之下,别的神经网络方法还是这样婶儿的(手动狗头):

bf3d1d8e-3537-11ee-9e74-dac502259ad0.gif

英伟达AI科学家Jim Fan评价:

这个方法非常令人耳目一新。

bf8bc3a8-3537-11ee-9e74-dac502259ad0.jpg

机器人再也不怕被忽悠瘸了

具体如何实现?

让机器人断腿继续走的秘密

快速适应环境变化是机器人部署到现实世界中非常重要的一项技能。

但目前常用的循环神经网络(RNN)技术存在策略单一、重参数化导致推理时间长、可解释性差等问题。

为此,作者直接“另起炉灶”,基于AutoML Zero技术开发了这项全新的四足机器人环境自适应策略:AutoRobotics-Zero (ARZ)。

关于,不熟悉的朋友再了解一下:

它是2020年诞生的一种“从零开始的自动机器学习”算法,出自谷歌大脑Quoc V.Le大神等人之手,仅使用基本数学运算为基础,它就能从一段空程序开始,自动发现解决机器学习任务的计算机程序。

在此,作者也将各种机器人行动策略表示为程序,而非神经网络,并仅使用基本的数学运算作为构建块,从头开始演化出可适应性策略及其初始参数。

bfae1354-3537-11ee-9e74-dac502259ad0.jpg

随着不断的进化,该方法能够发现控制程序(即Python代码,如下图所示),从而在与环境互动的同时,利用感觉运动经验来微调策略参数或改变控制逻辑(也就是当随机分支在随机时间突然中断时运行新的分支)。最终就可以在不断变化的环境下实现自适应。

bfc36d6c-3537-11ee-9e74-dac502259ad0.jpg

具体而言,ARZ的算法由两个核心函数组成:StartEpisode()和GetAction(),前者在机器人与环境交互的每个阶段开始时就开始运行,后者负责调整内存状态(因为策略被表示为作用于虚拟内存的线性寄存器)和代码修改。

在进化搜索上,ARZ则采用两种控制算法:负责多目标搜索的非支配排序遗传算法II(NSGA-II)和负责单目标搜索的正则化进化算法(RegEvo)。

如下图所示进化控制算法的评估过程,单目标进化搜索使用平均情节奖励作为算法的适应度,而多目标搜索优化了两个适应度指标:平均奖励(第一个返回值)和每次episode的平均步数(第二个返回值)。

bfc9d5a8-3537-11ee-9e74-dac502259ad0.jpg

以及作者介绍,为了预测动态环境中给定情况下的最佳行动,策略必须能够将当前情况与过去的情况和行动进行比较。

因此,ARZ所有策略都被设计为“有状态的”,即内存内容在一个事件的时间步长内是持续存在的,由此才得以完成自适应。

此外,有所不同的是,该方法还去掉了原始AutoML Zero技术中的监督学习模式,最终无需明确接收任何监督输入(如奖励信号)就可以让进化程序在整个生命周期内进行调整。

比神经网络更有效

作者用宇树科技的“莱卡狗”(Laikago)四足机器人模拟器在模拟环境中进行了效果测试。

最终,只有ARZ可以进化出在随机断腿情况下保持向前运动和避免摔倒的自适应策略。

bfed9ac4-3537-11ee-9e74-dac502259ad0.gif

相比之下,进行了全面超参数调整并使用最先进强化学习方法完成训练的MLP和LSTM基线都失败了:

要么不具有鲁棒性,不能每次都成功;

c4151424-3537-11ee-9e74-dac502259ad0.gif

要么一次都没有成功过。

c4eba804-3537-11ee-9e74-dac502259ad0.gif

需要注意的,这还是在ARZ使用的参数和FLOPS比MLP和LSTM都少得多的情况下。

下图则是统计数据:只要任何一列中的reward<400就表示该腿的大多数测试都以摔倒告终。

我们可以再次看到,除了ARZ,只有MLP方法能够在右后腿成功一次。

c6cda14a-3537-11ee-9e74-dac502259ad0.jpg

除了以上这些,ARZ还显现出了目前的RNN技术都做不到的可解释性。

如图所示,它在断腿案例中发现的各种策略可以都符号化为如下表示:

c6f3f070-3537-11ee-9e74-dac502259ad0.jpg

最后,除了机器人断腿走路,ARZ还可以在“具有随机倾斜轨道的cartpole系统”中自动保持平衡。

c71fdd2a-3537-11ee-9e74-dac502259ad0.gif

论文地址:

https://arxiv.org/abs/2307.16890

— 完 —

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28361

    浏览量

    206886
  • 神经网络
    +关注

    关注

    42

    文章

    4769

    浏览量

    100685
  • 大模型
    +关注

    关注

    2

    文章

    2406

    浏览量

    2621

原文标题:机器人也不怕被忽悠瘸了

文章出处:【微信号:tjrobot,微信公众号:天津机器人】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    鸥鹏机器人-龙视频演示

    机器人是有六的仿生机器人,每条有两个自
    发表于 03-23 17:49

    什么是龙机器人

    机器人种仿生机器人,由Openduino控制板控制,有
    发表于 03-24 16:17

    鸥鹏机器人还有六的,带你去见识下哦

    机器人机器人是有六
    发表于 03-24 16:25

    爬虫机器人,鸥鹏独家制作,儿童益智玩具,教学游戏

    爬虫机器人由Basicduino控制器控制。个连续旋转舵机和字舵盘构成它的四条
    发表于 03-28 16:28

    仿生机器人

    本帖最后由 红尘。破 于 2016-8-19 14:59 编辑 今天整理资料时发现了年前做的仿生机器人,当时买了
    发表于 08-19 14:59

    【NUCLEO-F412ZG申请】六仿生机器人

    ,大部分六机器人采用了仿昆虫的结构,6分布在身体的两侧,身体左侧的前、后足及右侧的中
    发表于 11-14 18:54

    机器人

    `这是创客集结号的作品机器人身体和都是通过3D打印技术打印出来的,通过自己安装连接上超声波传感器,制作成功的
    发表于 09-29 09:55

    求六机器人的图纸

    `业余,想想做做六机器人。但是苦于无大致图纸,卡在建模的问题上。求六机器人的图纸,有清晰的尺寸就行(主要是
    发表于 03-26 18:43

    机器人与编程的区别

    在前篇文章中讲了机器人与编程的区别,但总感觉讲的比较空泛,这篇文章继续讲讲那些区别。计算机编程和机器人编程最大的区别就是个是控制虚拟的,
    发表于 09-01 07:12

    机器人】SOLO技术详解--(1)介绍(2)平台和机器人概述【翻译】精选资料分享

    传感器。机器人重2.2kg,有8个自由度,四条腿上都搭配了足底传感器。其他零件由3D打印和现成的零件构成,可以做出重量轻且低成本的机器人
    发表于 09-13 06:33

    机器人的机构设计

    机器人属于复杂机电系统,需要综合生物、机械、电子、控制等学科内容,具体涉及仿生机构设计、灵巧运动机构设计、高性能驱动器制造,行走稳定性控制、强化学习等在内的多个研究方向。其中,机构设计是保障
    发表于 09-15 06:54

    如何完整的组装机器人

    如何完整的组装机器人
    发表于 09-24 07:00

    基于ADAMS的仿生机器人结构设计

    利用ADAMS软件虚拟样机技术,设计了液压驱动的仿生机器人机械结构。通过分析哺乳类动
    发表于 03-01 11:41 3次下载

    机器人Mochibot拥有32 能够全方位移动

    以目前的技术而言,一条机器人很难站得稳,双相对好点,四条则非常稳当,你可以发现
    发表于 05-10 17:19 918次阅读

    +轮式动力!瑞士机器人展示最佳混合步态、运动更灵活

    +轮式动力!瑞士机器人ANYmal展示最佳混合步态,运动更灵活,机器人,
    发表于 02-20 13:44 2465次阅读
    <b class='flag-5'>腿</b>+轮式动力!瑞士<b class='flag-5'>四</b><b class='flag-5'>足</b><b class='flag-5'>机器人</b>展示最佳混合步态、运动更灵活