一种如何自学几种新技巧的机器人-电子发烧友网

约翰霍普金斯大学的计算机科学家采用一种通常用于教狗坐下和坐下的训练技术，向机器人展示了一种如何自学几种新技巧的机器人，包括堆砌块。通过这种方法，名为Spot的机器人可以在几天内学习通常需要一个月的时间。

通过使用积极强化，这是任何使用过的对待改变狗的行为的人都熟悉的方法，团队极大地提高了机器人的技能，并且很快地完成了训练，使训练现实世界中的机器人成为更可行的企业。这些发现新发表在名为“ Good Robot！”的论文中。

“这里的问题是我们如何让机器人学习技能？”约翰霍普金斯大学计算交互与机器人实验室的博士生安德鲁·洪特说。“我有狗，所以我知道奖励的工作，这就是我设计学习算法的灵感。”

与天生具有高度直觉的大脑的人和动物不同，计算机是空白板，必须从头开始学习一切。但是，真正的学习通常是通过反复试验来完成的，机器人专家仍在研究如何从错误中有效学习。

该团队在这里通过设计一种奖励系统来实现这一目标，该奖励系统可以像对待狗一样对待机器人，为机器人工作。狗可能会因为做得好的工作而得到饼干，而机器人则获得了数字积分。

洪特回忆说，他曾经教过他的小混混小狗叫利亚（Leah）命令“离开它”，这样她就可以无视步行中的松鼠。他使用两种类型的零食，普通的教练零食和更好的东西，例如奶酪。当莉亚兴奋而无所事事时，她一无所有。但是当她冷静下来并移开视线时，她得到了好东西。“那时候我给了她奶酪，然后说，‘离开！好呀！’”

同样，要堆积块，发现机器人需要学习如何专注于建设性行动。当机器人探索积木时，它很快了解到正确的堆叠行为可以赚取高分，而错误的堆叠则不能赚到高分。伸出手，但不理解障碍？没有分数敲一堆？绝对没有分。通过将最后一个区块放在四个区块的堆栈之上，Spot获得了最大的收益。

训练策略不仅有效，而且花了几天的时间来告诉机器人过去需要数周的时间。通过首先训练类似于视频游戏的模拟机器人，然后使用Spot运行测试，该团队能够减少练习时间。

亨特说：“机器人想要更高的分数。”“它可以迅速学习正确的行为以获得最佳回报。实际上，机器人过去通常要花一个月的时间才能达到100%的精度。我们能够在两天内做到这一点。”

积极的强化不仅可以帮助机器人自学积木，而且通过点系统，机器人也可以很快地学会其他几项任务，甚至包括如何玩模拟的导航游戏。在所有情况下都可以从错误中学习，这对于设计一种可以适应新环境的机器人至关重要。

洪特说：“起初，机器人不知道自己在做什么，但是每次练习都会越来越好。它永远不会放弃，并且会不断尝试堆叠，并且能够100%地完成任务。”

该团队认为，这些发现可以帮助训练家用机器人去洗衣服和洗碗-这些任务在公开市场上很流行，并且可以帮助老年人独立生活。它还可以帮助设计改进的自动驾驶汽车。

哈格说：“我们的目标是最终开发出可以在现实世界中完成复杂任务的机器人，例如产品组装，照顾老人和手术。”“我们目前不知道如何编程这样的任务-世界太复杂了。但是像这样的工作向我们表明，机器人可以学习如何以安全且安全的方式完成此类现实任务的想法是有希望的有效的方式。”

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
211

文章
28762

浏览量
208978
自动驾驶

自动驾驶

+关注

关注
785

文章
13960

浏览量
167282

【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

，一次生成深度信息。自主机器人定位任务的本质是对机器人自身状态的估计问题，包括位置，朝向，速度等问题。路径规划旨在找到从起点到目标区域的路径，确保路径的可行性和最优性。路径规划方法包括变分方法，图搜

发表于 01-04 19:22

【「具身智能机器人系统」阅读体验】+两本互为支持的书

最近在阅读《具身智能机器人系统》这本书的同时，还读了《计算机视觉之PyTorch数字图像处理》一书，这两本书完全可以视为是互为依托的姊妹篇。《计算机视觉之PyTorch数字图像处理》是介绍

发表于 01-01 15:50

【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

的局限性以及衡量大模型的关键指标。阅读了该部分后，我感受到了一种前所未有的震撼，这种震撼不仅来源于技术本身的先进性，更来源于它对传统机器人控制方式的颠覆。传统机器人的局限性与大模型的变革传统的

发表于 12-29 23:04

【「具身智能机器人系统」阅读体验】1.初步理解具身智能

、家庭服务机器人等。具身智能机器人技术与市场的融合闭环是自主经济中重要的发展方向之一。具身智能机器人是一种能够在没有人类直接控制的情况下自

发表于 12-28 21:12

《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

意味着在“具身智能”领域，还没有哪一个玩家能像O社那样能站在AGI的制高点。具身智能从字面上拆解为“具身+智能”，指的是一种将机器学习算法适配至物理实体，从而与物理世界交互的AI范式。通俗一

发表于 12-19 22:26

鸿蒙机器人与鸿蒙开发板联动演示

鸿蒙机器人与鸿蒙开发板联动演示，机器人的角色为迎宾机器人，开发板负责人宾客出现监听

发表于 12-02 14:55

工业机器人控制方式有几种

景，下面将介绍这四种控制方式。一、点位控制方式（PTP）点位控制方式是工业机器人最基本的控制方式之一。这种控制方式的特点是只控制工业机器人

发表于 09-04 09:31 •1337次阅读

开源项目！用ESP32做一个可爱的无用机器人

简介作者在完成硕士论文答辩后，利用空闲时间制作了一个他一直想做的机器人——可爱无用机器人。无用机器人原理是

发表于 09-03 09:34

人形机器人的理想与现实

究竟哪一种才代表人形机器人产业的真相呢？

发表于 07-10 22:59 •3933次阅读

工业机器人视觉技术的应用分为哪几种?

，机器人可以识别和定位物体的位置、形状、颜色等特征。这些信息可以用于机器人的导航、抓取、装配等任务。 1.1 颜色识别颜色识别是物体识别的一种常见方法。通过分析物体表面的颜色信息，机器人

发表于 07-09 09:38 •892次阅读

Al大模型机器人

金航标kinghelm萨科微slkor总经理宋仕强介绍说，萨科微Al大模型机器人有哪些的优势?萨科微AI大模型机器人由清华大学毕业的天才少年N博士和王博士团队开发，与同行相比具有许多优势：语言

发表于 07-05 08:52

码垛机器人的组成和工作原理

码垛机器人是一种自动化程度较高的设备，能够大大提高生产效率和减轻人工劳动强度。松乐智能装备这里分享一下码垛机器人的组成和工作原理。一、

发表于 07-04 15:58 •526次阅读

abb机器人系统密钥在哪

ABB机器人系统密钥是ABB机器人系统中用于保护其知识产权和确保系统安全性的一种技术手段。本文将详细介绍ABB机器人系统密钥的相关知识，包括其定义、作用、获取方式、使用方法以及注意事项

发表于 06-17 09:45 •1504次阅读

abb工业机器人的编程语言是什么

ABB工业机器人的编程语言主要是RAPID（Robot Application Programming Interface for Development），它是一种高级编程语言，专门为工业机器人

发表于 06-16 16:49 •2915次阅读

基于FPGA EtherCAT的六自由度机器人视觉伺服控制设计

和增强系统处理图像的实时性，本文提出了一种伊瑟特的六自由度机器人视觉伺服控制系统，将摄像头集成到基于 Zynq的伊瑟特主站上，提高了视觉伺服的实时性.经测试，该平台能够对视觉检测目标的变化做出及时的反应

发表于 05-29 16:17

搜索历史

一种如何自学几种新技巧的机器人

评论

【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

【「具身智能机器人系统」阅读体验】+两本互为支持的书

【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

【「具身智能机器人系统」阅读体验】1.初步理解具身智能

《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

鸿蒙机器人与鸿蒙开发板联动演示

工业机器人控制方式有几种

开源项目！用ESP32做一个可爱的无用机器人

人形机器人的理想与现实

工业机器人视觉技术的应用分为哪几种?

Al大模型机器人

码垛机器人的组成和工作原理

abb机器人系统密钥在哪

abb工业机器人的编程语言是什么

基于FPGA EtherCAT的六自由度机器人视觉伺服控制设计