0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员发明四腿机器人,并用它实现低成本机器算法

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2021-01-21 13:34 次阅读

看过《蚁人》的朋友肯定会为蚁人灵活的身姿和矫捷的身手所折服。 现如今,虽然你成为不了蚁人,却有机会拥有一位 “类蚁人” 朋友 —— 四足机器人 RealAnt。RealAnt 是一种低成本的四足机器人,可以通过强化学习来完成指定动作。拥有蚂蚁般灵活四肢的机器人 RealAnt 一经问世,便广受好评。

在过去的十几年里,机器人学家和计算机学家们试图利用强化学习(RL)的方法来训练机器人有效地导航和完成各种基本任务。然而,到目前为止,制作一个能够支持 RL 算法且大众负担得起的机器人仍相当具有挑战性。 令人兴奋的是,最近研究人员发明了一种四腿机器人,并用它来实现一种低成本的机器人算法。在 arXiv 上发表的一篇论文中提出了相关的新型机器人平台,这是一个简单且价格合理的真实世界版 “蚂蚁” 机器人模拟环境,通常被用于 RL 研究。

Ote 机器人公司的 RealAnt 机器人平台是为实现现实世界中的强化学习而研究和开发的。其拥有完整的解决方案,并有网络摄像机为基础的跟踪系统。 “我们工作的最初灵感来自 RL 研究,该研究成功地证明了在仿蚂蚁以及仿人机器人上,可以通过强化学习从零开始学会走路。”Ote Robotics 的联合创始人 Jussi Sainio 表示,算法的基本前提是编程,目的是使机器人完成任务的过程变得更容易、更自然,通过确定可用的传感器测量值、运动动作设定目标,并将它们全部插入强化学习算法,该算法就能解决其余问题。 降低训练成本的高效率四足机器人亟待开发

一般来说,大多数机器人的研究是利用昂贵的设备进行的,花费高达数千美元,并不是所有研究人员都负担得起。与此同时,传统的控制算法需要易于实现的精确硬件模特,这使得机器人在设计上面临诸多限制。而强化学习算法能够在不建立动力学模型的情况下学习控制器,还可以处理噪声的观测和控制,优势有目共睹。 近年来,强化学习领域取得了显著的进展,在解决具有挑战的控制问题方面取得了许多成功。这很大程度上取决于模拟器可以用快速测试算法性能。然而,模拟器也有弊端,其常常会对世界做出不切实际的假设。为了减少因误判而付出的无用劳动,研究人员们需要一种将强化学习的发展建立在现实世界的问题上的方法。

Sainio 认为,与模拟器环境相比,没有一个完整的软件和硬件组合可以从现实世界的强化学习开始。因此,他们开始构建自己的机器人和接口软件原型。 基于此,Sainio 和他同事们工作的主要目标是基于现有的基线 RL 解决方案创建一个简单而低成本的机器人平台。这样一个平台将允许更多的研究人员建造和测试能够在现实世界中完成各种基本任务的自主机器人。 经过不断探索,Ote 机器人公司开发了一个最小的低成本四足机器人 ——RealAnt 以及一个物理版本的基准测试平台。

RealAnt 的优点是显而易见的,它功能齐全、简约、成本低廉。此外,它可以自主学习走路,协调地移动腿,并能在给定的环境中感知自己的位置和方向。利用 RL 算法,可以训练它像真正的蚂蚁那样行动,从而执行各种简单而有价值的任务。 最初,RL 算法只有在机器人模拟训练数千小时后才能表现良好。然而,通过计算机科学家的努力,已经能够用很少的训练数据来教蚂蚁四足机器人 RealAnt 学会行走,从而达到了高样本效率。这使得在现实世界中直接训练机器人成为可能,消除了基于仿真的训练需求成本。

ef66abfc-584d-11eb-8b86-12bb97331649.png

图 | 噪声对降低学习效率的观测 研究人员们是通过强化学习实验一步步验证了自己创建的机器人平台,并同时提供了一组基准任务的基线结果。通过实验,他们证明了运用 TD3 算法可以从不到 45 分钟的经验中学会行走实相。他们在 MuJoCo 和 PyBullet 中提供了机器人的模拟器版本(具有相同的尺寸、状态动作空间和延迟噪声观测)。

ef94633a-584d-11eb-8b86-12bb97331649.png

绘制每个任务三次运行的平均值和标准差,TD3 能够在 40 分钟内学会所有任务。 实验中考虑进了三个基准任务:

站直

转动 180 度

尽可能快地向前走。

实验发现,TD3 算法能够成功地学习所有三个任务。学会站立大约需要 12 分钟的经验,学会转身需要 35 分钟的经验,学会走路需要 40 分钟的经验。 “人们可以把 RealAnt 平台想象成‘Ant’模拟器环境的真实版本,这是 RL 的一个流行基准。”Sainio 说,他们创建的是最便于在现实世界展开强化学习的机器人平台之一。 RealAnt 平台包括机器人接口所需的机器人硬件(电机、传感器)和软件堆栈(通信、跟踪),而已经对外公布的基线强化学习解决方案就是教它从零开始走路的方法。Sainio 表示,示例解决方案很简单,对每项学习任务都较少使用 ML 方面的指导,且不用做太多的人工奖励工程来塑造学习绩效,这使得定义新任务变得简单明了。 值得一提的是,RealAnt 平台的主要优势在于,它是现成的,而且价格合理。低制造成本和易于组装的特点使得 RealAnt 可以更便捷地被世界各地的人所使用。此外,与当今市场上更昂贵、更复杂的机器人相比,它容易大规模进行生产部署。

8 个低成本的智能伺服电机移动保 “价” 护航

RealAnt 作为一个最小的、低成本的物理版本的 “Ant”,其基准研究对现实世界中的强化学习有深刻意义。与 “Ant” 基准测试类似,RealAnt 是一个 8 自由度的四足机器人,并基于易于获得的电子元件和 3D 打印体。RealAnt 中使用的所有组件都较易得到。 “机器人的身体部位都是三维打印的,它们足够小,可以用大多数消费者的三维打印机打印。”Sainio 提到,这使得该机器人的生产和改装成本比采用激光切割或机械加工金属、塑料板制造的机器人要低很多。由于 RealAnt 设计采用低成本电机,通过限制电机的最大扭矩能够小心地驱动电机,因此它们能够承受随机探索和任务训练期间的连续粗暴运动。 具体来看,RealAnt 主体由 4 个 3D 打印支腿,8 个 Dynamixel AX-12A 伺服系统(和 8 个 FP04-F2 机架一起销售)以及 3 个三维打印的上下躯干构成。机器人的每只腿由两个 Dynamixel 伺服关节组成,使用 Robotis FP04-F2 框架相互连接。使用 3D 打印的躯干顶板和底板将四个腿部组件连接在一起。3D 打印机易于使用,允许快速打印和经济高效的制造。零件可以使用消费类 3D 打印机(Creality Ender 3 v2)以 PLA(Prusament 灯丝)打印。

efb33544-584d-11eb-8b86-12bb97331649.png

图 | RealAnt 机器人的示意图细节(所有单位均为毫米)

令手残党倍感欣慰的是,RealAnt 可以在不到一小时的时间内使用十字螺丝刀、切边钳这些组件组装起来。这比很多同类型机器人的组装更加友好。 另一方面,上文提到,目前可供研究的机器人平台要么非常昂贵,要么无法处理强化学习中探索控制的滥用。而此次开发的用于强化学习基准测试的最低成本物理版本平台价格上是绝对的实惠。RealAnt 的材料成本仅为 350AC(410 美元)。 RealAnt 机器人比其他支持 RL 的现有四足类机器人更便宜的原因之一是它的身体使用 8 个低成本的智能伺服电机移动,而不是更昂贵和复杂的电机。此外,为了追踪机器人的位置和方向,还利用了可以轻松打印在纸上的 AR 标签和廉价的外部摄像头。

在真实世界与模拟环境的出色表现有望破圈

经过反复测试,Sainio 和他的同事在模拟和真实世界的实验中综合评估了 RealAnt,事实证明,该机器人在所有这些测试中都表现得非常出色,显示出广阔的应用前景。 到目前为止,大多数用于机器人应用的 ML 和 RL 技术主要是在模拟环境中训练的。研究人员希望 RealAnt 能开辟新的令人兴奋的可能,使机器人可以在模拟和物理世界中一同进行训练和测试。 一个好消息是,RealAnt 的硬件和软件都是开源的,完全组装好的机器人也可以在 Ote Robotic 的网站上轻松在线购买。这为更多研究者得到并使用它提供了很大便利。

此套餐包括:一个完全组装的 RealAnt V1 机器人、带有 8 个 Robotis Dynamixel AX-12A 智能执行器、Robotis OpenCM9.04A 板、USB电源线、一个机器人标签和一个参考标签板、12V 5A 电源。 Sainio 和他的同事们创建的机器人平台可以很快帮助其他团队在真实的机器人上测试他们的 RL 和 ML 算法。研究人员们希望 RealAnt 未来可以促进更广泛的应用和发展,例如在农业环境中,自主学习的机器人可以用来根除杂草和收获植物,帮助促进生物多样性,甚至可能减少杀虫剂的使用。 Sainio 说:“我们现在打算对 RealAnt 平台进行微调和扩展,以增强硬件的能力,比如让机器人拥有更先进的感知能力和可能的操纵器,并在现有在线平台的基础上同时运行多个机器人。同时,我们也在研究如何让 RealAnt 更快地完成其他更具挑战性的任务,进一步缩短训练时间。”

原文标题:“四足蚁人”诞生,可通过强化学习完成指定动作

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28191

    浏览量

    206505
  • 接口
    +关注

    关注

    33

    文章

    8496

    浏览量

    150834

原文标题:“四足蚁人”诞生,可通过强化学习完成指定动作

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮!

    ,为学生和研究人员提供系统的学习资源,培养更多的专业人才。 同时,随着具身智能机器人技术对社会的影响越来越大,通过本书可以向公众普及相关知识,提升社会对新技术的认知和接受度,为技术的发展创造良好
    发表于 11-11 10:20

    七腾机器人:防爆轮式机器人-轮八驱全新上线

    今日,七腾机器人有限公司(以下简称“七腾机器人”)推出全新产品:防爆轮式机器人-轮八驱。该款产品是七腾轮式巡检机器人产品系列的最新成员,防
    的头像 发表于 10-21 16:32 146次阅读
    七腾<b class='flag-5'>机器人</b>:防爆轮式<b class='flag-5'>机器人</b>-<b class='flag-5'>四</b>轮八驱全新上线

    机器人仿真的类型和优势

    机器人仿真使机器人工程师和研究人员能够创建机器人及其环境的虚拟模型。这项技术支持在仿真的无风险环境中测试和验证机器人设计与控制
    的头像 发表于 10-14 10:43 418次阅读
    <b class='flag-5'>机器人</b>仿真的类型和优势

    开源项目!用ESP32做一个可爱的无用机器人

    、固件烧录等。 注意事项 制作这个机器人的材料成本比较高,接近一台全新笔记本电脑的价格。此外,如果没有焊接经验,整体成本可能更高,因为还需要涉及到PCB组装。 完成 完成后,机器人
    发表于 09-03 09:34

    开源项目!用ESP32做一个可爱的无用机器人

    、固件烧录等。 注意事项 制作这个机器人的材料成本比较高,接近一台全新笔记本电脑的价格。此外,如果没有焊接经验,整体成本可能更高,因为还需要涉及到PCB组装。 完成 完成后,机器人
    发表于 08-30 14:50

    ROS让机器人开发更便捷,基于RK3568J+Debian系统发布!

    。 ROS系统主要特点有哪些 (1) 提供丰富的机器人算法机器人的各种控制以及通信离不开算法库的支持,ROS系统提供丰富且功能强大的机器人
    发表于 07-09 11:38

    Al大模型机器人

    金航标kinghelm萨科微slkor总经理宋仕强介绍说,萨科微Al大模型机器人有哪些的优势?萨科微AI大模型机器人由清华大学毕业的天才少年N博士和王博士团队开发,与同行相比具有许多优势:语言
    发表于 07-05 08:52

    基于FPGA EtherCAT的六自由度机器人视觉伺服控制设计

    ,为工业自动化提供了一套切实可行的方案。 本文针对基于机器视觉的工业机器人进行研究,主要工作包括以下几点: (1)设计了基于 伊瑟特的六自由度机器人视觉伺服控制系统总体方案。以 E
    发表于 05-29 16:17

    其利天下技术·搭载无刷电机的扫地机器人的前景如何?

    于部分消费者来说,扫地机器人仍然是一笔不小的开支。 4.扫地机器人的未来发展前景 展望未来,搭载无刷电机的扫地机器人有望在多个方面实现突破。随着传感器技术和人工智能
    发表于 05-05 15:03

    为什么机器人设计常借鉴狗的外形特征?

    刘表示,机器狗是机器人的一部分,被称为“足动物”,意思很明显是“”。
    发表于 04-10 14:30 376次阅读

    视觉机器人焊接的研究现状

    视觉机器人焊接技术是将计算机视觉与机器人技术相结合,实现自动焊接过程中的实时检测、跟踪和控制。这一领域的研究一直处于不断发展之中,吸引了众多研究人员
    的头像 发表于 04-02 15:34 485次阅读
    视觉<b class='flag-5'>机器人</b>焊接的<b class='flag-5'>研究</b>现状

    瑞士苏黎世联邦理工学院新型机器人完成开关门、移动任务

    据本周五出版的Popular Science杂志报道,近日瑞士苏黎世联邦理工学院机器人系统实验室的科研团队展示了新研究进展:他们训练了自家的机器狗,让其用单操控门锁和移动物品,同时依
    的头像 发表于 02-25 11:55 629次阅读

    LabVIEW的六轴工业机器人运动控制系统

    LabVIEW开发六轴工业机器人运动控制系统 本项目开发了一个高效的工业机器人控制系统,重点关注于运动学算法和轨迹规划算法实现和测试。La
    发表于 12-21 20:03

    开源作品!稚晖君超迷你低成本开发板、超酷机器人、智能手环等参考方案

    复合机器人 本项目中,履足式复合机器人拥有两种行进模式:足行进模式、履带行进模式,应对不同场景及地形时能够切换形态。足形态下整体总共拥有8个自由度DOF,单
    发表于 12-12 10:28

    ROS让机器人开发更便捷,基于RK3568J+Debian系统发布!

    ROS系统是什么 ROS(Robot Operating System)是一个适用于机器人的开源的元操作系统。它提供了操作系统应有的服务,包括硬件抽象,底层设备控制,常用函数的实现,进程间消息传递
    发表于 11-30 16:01