0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个开源的低成本机器人学习平台ROBEL

机器人技术与应用 来源:机器人技术与应用 2019-11-25 11:02 次阅读

为了让机器人研究走向大众,加州大学伯克利分校(UC Berkeley)和谷歌大脑的研究人员提出了一个开源的低成本机器人学习平台ROBEL(RoboticsBenchmarks for Learning with Low-Cost Robots)。

ROBEL可以作为快速实验平台,支持各种实验需求,以及新的强化学习和控制方法的开发,同时提供主要用于促进现实世界物理硬件研究和开发的基准任务。其由D’Claw和D'Kitty组成,D'Claw是一个有三只手臂的机械臂型机器人,可以帮助学习灵巧的操作任务;D'Kitty是一个有四条腿的机器人,可以帮助学习灵活的腿部运动任务。该机器人平台具有低成本、模块化、可靠性高、易于维护等特点,并且功能强大,可支持基于硬件的强化学习。

图中左:十二自由度D'Kitty;中:9 自由度D'Claw;右:功能齐全的D'Claw 装置D’Lantern。

为了使机器人成本便宜和易于构建,研究人员基于现成的组件和常见的原型工具(3D打印或激光切割)设计了ROBEL。该设计很容易组装,只需要几个小时即可构建。

为了使机器人成本低且易于构建,研究人员基于现成的组件和常用的原型制作工具(3D打印或激光切割)设计出ROBEL,并提供详细的零件清单、组装说明和入门软件说明。ROBEL设计易于组装,仅需几个小时即可构建。

谷歌设计了一套对 D’Claw和D’Kitty两个平台都适用的任务,可用于对现实世界的机器人学习进行基准测试。ROBEL的任务定义包括密集和稀疏任务目标,并在任务定义中引入硬件安全指标,例如,指示关节是否超过“安全”操作界限或作用力阈值。此外,ROBEL还为所有任务提供模拟器,以促进算法开发和快速原型设计。D’Claw 任务主要围绕三种常见的操作行为展开:摆形(Pose)、旋转(Turn)和拧(Screw);D’Kitty任务主要围绕三种常见的移动行为——站立、定向和行走展开。针对这些基准任务,研究人员评估了几种深度强化学习方法,评估结果和最终策略被作为baseline包含在软件包中以供比较。

ROBEL平台支持直接的硬件训练,迄今已积累了超过1.4万h的实际经验。为了确保平台和基准方法的可重复性,研究人员通过两个不同的实验室分别对ROBEL进行了研究,本研究仅使用软件分发和文档、不允许亲自访问,利用ROBEL的设计文档和组装说明,两者都可以复制两个硬件平台。基准任务训练在两个实验室分别构建的机器人上进行,实验表明,在两个不同地点打造的两个D'Claw机器人,它们不仅训练进度相似,而且最终收敛到了相同的性能,这说明ROBEL基准具备良好的可重复性。

ROBEL在各种强化学习研究中都非常有用。D’Claw平台是完全自主的,可以在很长一段时间内维持实验的可靠性,而且可以使用刚性和柔性对象的各种强化学习范例和任务改进实验。重要的是,D'Claw平台是高度模块化的,而且具备高度可重复性,便于进行扩展实验。通过扩展设置,研究人员发现多个D'Claws可以通过共享经验更快地对任务进行集体学习,通过共享SAC的分布式版本的硬件训练流程,其可以面向多个目标任务实现任意角度的结合。在多任务定制中,完成五个任务只需要单个任务经验的2倍时间即可。

同时,研究人员成功地在D’Kitty平台上部署了强大的移动策略,比如,D'Kitty可以在“盲眼”条件下在室内和室外地形上稳定行走,展现了步态的稳健性。

具体而言,在杂乱的室内环境行走时,通过MuJoCo模拟通过自然策略梯度训练的Sim2Real策略,机器人可以在随机扰动的条件下实现行走,并跨过障碍物;在布满碎石和树枝的室外环境行走时,通过自然策略梯度在MuJoCo模拟中训练的Sim2Real策略具有随机的高度场,机器人可以学习在分布着碎石和树枝的户外环境中行走;在室外斜坡和草丛环境中,通过自然策略梯度在MuJoCo模拟中训练的Sim2Real策略具有随机高度场,机器人可以学习在缓坡上行走。

当D’Kitty收到有关其躯干和场景中目标的信息时,其可以学会与表现出复杂行为的目标进行交互。比如,通过HierarchicalSim2Real训练的策略可以学习躲避移动障碍物,到达目标位置;通过Hierarchical Sim2Real训练的策略学习将目标推向移动目标(由手中的控制器标记);双机器人协同-通过Hi-Herarchical Sim2Real训练的策略,可以学习协调两个D'Kitty机器人,将沉重的障碍物推向目标位置。

总之,ROBEL可以满足新兴的基于学习范式的需求,这些范式需要高度的可扩展性和弹性。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28231

    浏览量

    206614
  • 3D打印
    +关注

    关注

    26

    文章

    3544

    浏览量

    108881

原文标题:加州大学伯克利分校和谷歌大脑联合推出低成本机器人训练平台

文章出处:【微信号:robotmagazine,微信公众号:机器人技术与应用】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    香蕉派开源社区与矽昌通信共推BPI-Wifi5 低成本路由器开源方案

    香蕉派开源社区与矽昌通信共推BPI-Wifi5 低成本路由器[]() 香蕉派 BPI-Wifi5 路由器采用矽昌SF19A2890S2芯片方案设计。它是款高性能无线路由器,适用于小微企业、家庭
    发表于 11-28 10:37

    【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮!

    的。 这种理论强调,智能行为源于智能体的物理存在和行为能力,智能体必须具备感知环境并在其中执行任务的能力。 具身智能的实现涵盖了机器学习、人工智能、机器人学、计算机视觉、自然语言处理和强化学习
    发表于 11-11 10:20

    使用机器学习和NVIDIA Jetson边缘AI和机器人平台打造机器人导盲犬

    Selin Alara Ornek 是名富有远见的高中生。她使用机器学习和 NVIDIA Jetson 边缘 AI 和机器人平台,为视障人士打造了
    的头像 发表于 11-08 10:05 327次阅读

    麻省理工学院推出新型机器人训练模型

    近日,据TechCrunch报道,麻省理工学院的研究团队展示了种创新的机器人训练模型,该模型突破了传统模仿学习方法的局限,不再依赖标准数据集,而是借鉴了大型语言模型(LLM)如GPT-4等所使用的大规模信息处理方式,为
    的头像 发表于 11-04 14:56 416次阅读

    “0元购”智元灵犀X1机器人,软硬件全套图纸和代码全公开!资料免费下载!

    提供核心组件的基础上,智元机器人完整地开源了软硬件全套图纸和代码,总资料大小超过1.2GB。在整机结构硬件方面,提供了整机结构图纸、整机硬件框图、整机BOM,细致到每一个螺丝和齿轮,确保开发者能够精确
    发表于 10-25 15:20

    机器人的三大矩阵是什么及关系式

    机器人学中,三大矩阵主要指的是与机器人位移、速度和力相关的矩阵,它们分别揭示了机器人在不同空间(如关节空间和作业空间)之间的映射关系。这三大矩阵及其关系式可以概括如下: 1. T矩阵(变换矩阵
    的头像 发表于 09-04 09:37 959次阅读

    开源项目!用ESP32做一个可爱的无用机器人

    简介 作者在完成硕士论文答辩后,利用空闲时间制作了直想做的机器人——可爱无用机器人。 无用
    发表于 09-03 09:34

    开源项目!用ESP32做一个可爱的无用机器人

    简介 作者在完成硕士论文答辩后,利用空闲时间制作了直想做的机器人——可爱无用机器人。 无用
    发表于 08-30 14:50

    NVIDIA Isaac 机器人平台利用最新的生成式 AI 和先进的仿真技术,加速 AI 机器人技术的发展

    观众展示了用于人形机器人学习的通用基础模型 Project GR00T(代表通用机器人 00 技术)。Project GR00T 利用 NVIDIA Isaac 机器人平台的各种工具来创建用于人形
    的头像 发表于 06-04 18:00 7641次阅读
    NVIDIA Isaac <b class='flag-5'>机器人平台</b>利用最新的生成式 AI 和先进的仿真技术,加速 AI <b class='flag-5'>机器人</b>技术的发展

    Hugging Face推出开源机器人代码库LeRobot

    AI领域的佼佼者Hugging Face近日宣布重磅推出并全面开源机器人工具包——LeRobot。这创新工具包基于史上最大规模的众包机器人数据集,为开发者提供了
    的头像 发表于 05-09 10:32 552次阅读

    NVIDIA Isaac机器人平台升级,加速AI机器人技术革新

    NVIDIA Isaac机器人平台近期实现重大升级,通过引入最新的生成式AI技术和先进的仿真技术,显著加速了AI机器人技术的发展步伐。该平台正不断扩展其基础模型、机器人学习框架、AI工
    的头像 发表于 03-27 10:36 643次阅读

    机器人学习中主流智能抓取方案

    RGB颜色空间由红绿蓝三种基本色组成,叠加成任意色彩,同样地,任意种颜色也可以拆解为三种基本色的组合,机器人通过颜色坐标值来理解“颜色”。
    发表于 03-13 10:07 286次阅读
    <b class='flag-5'>机器人学习</b>中主流智能抓取方案

    搬运机器人已经成为提高效率、降低成本的关键技术

    物流、制造业和仓储等领域,搬运机器人已经成为提高效率、降低成本的关键技术。近年来,随着技术的不断突破,搬运机器人正朝着更加智能、高效和可靠的方向发展。
    的头像 发表于 01-22 12:00 511次阅读
    搬运<b class='flag-5'>机器人</b>已经成为提高效率、降<b class='flag-5'>低成本</b>的关键技术

    开源项目!教你如何复刻自平衡赛车机器人、智能家居中控、竞技机器人先进模糊控制器等

    开源项目作品 为了方便大家更好提升自己,电子发烧友小编为大家整理了些工程师大佬设计的开源项目作品,供大家可以参考学习,希望对广大工程师有所帮助。 1.用全志R128复刻自平衡赛车
    发表于 12-26 09:17

    开源作品!稚晖君超迷你低成本开发板、超酷机器人、智能手环等参考方案

    出圈的稚晖君又双叒叕来整活啦! 这次稚晖君开源了基于全志F1C200s的超迷你&低成本的Linux开发板,项目名为Planck Pi,F1C200s采用的ARM9架构,
    发表于 12-12 10:28