0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

3.2万美元造成的斯坦福双臂机器人爆红后,项目负责人亲自发翻车视频

AI科技大本营 来源:CSDN 2024-01-08 16:29 次阅读

过去几年间,随着 AI 的发展,一个属于机器人的万亿级赛道正在火热开启,无论是 Google 、特斯拉,还是国内的达闼、追觅、以及稚晖君创业的「智元机器人(AGIBot)」公司均投身其中。

不过,对于普通用户而言,机器人最为重要的并不是设计得多么好看,而是实用性。在当代年轻人的“精致懒”之吃饭要人弄、家务要人做状态下,如果有一款集做饭、收纳、保洁等多个才艺于一身的机器人,岂不美哉!

近日,斯坦福大学 3 位研究人员让许多用户的美梦成真了,其发布了一款名为Mobile Aloha的 AI 机器人。一经展示之后,这款机器人便迅速在网络上走红,成为不少人想人手一个的大热门产品

只因为它,不仅可以煎大虾,亲自端上桌:

529bf5d0-adfd-11ee-8b88-92fbcf53809c.gif

也能收拾不小心洒出来的水渍:

52ad0366-adfd-11ee-8b88-92fbcf53809c.gif

还能打开柜门,归纳整理:

52c7aa4a-adfd-11ee-8b88-92fbcf53809c.gif

刷碗:

530ceab0-adfd-11ee-8b88-92fbcf53809c.gif

简单来看,Mobile Aloha 是一种用于双手遥控操作的低成本开源硬件系统,解决了训练需要人类操作员仔细指导的移动双手机器人的高成本和技术挑战。

值得一提的是,Mobile Aloha 能实现以上操作,并非完全自主,其全身也支持远程操作。

得益于生成模型的成功,MobileAloha 可以快速从人类演示中学习,而且它可以只通过 50 次的演示就能学会一件事,合作训练可以提高成功率高达 90%。

同时,整个机器人机载电源和计算在内的成本为3.2 万美元,远远低于市场现有的系统及硬件。更让人兴奋的是,Mobile Aloha 的软硬件均是开源的,也方便所有的 AI 爱好者、开发者深入学习与共建。

5366daf2-adfd-11ee-8b88-92fbcf53809c.png

左:用户通过遥控操作从冰箱中获取食物;右图:Mobile ALOHA 可以通过模仿学习完成复杂的长时间任务

硬件代码:https://github.com/MarkFzp/mobile-aloha

软件代码:https://github.com/MarkFzp/act-plus-plus

项目地址:https://mobile-aloha.github.io/

研究 5 年,以低成本打破传统机器人系统的局限性

项目的负责人之一 Tony Z.Zhao 表示,“这个我过去 5 年里最努力的项目之一!”

而之所以会萌生开发这样一款会做饭的 AI 机器人,是因为该研究团队发现,大多数机器人操纵任务都侧重于桌面操纵。这包括最近基于 Transformer 和 Diffusion 模型(广泛应用于生成式人工智能的架构)建立的一系列模型。

然而,日常环境中的许多任务都需要全身协调的流动性和灵巧的操作。譬如,把一个罐子放进厨房的柜子里,那么,机器人需要首先导航到柜子边上,这就需要机器人底座可以移动;进而为了打开橱柜,机器人需要后退,同时牢牢抓住两个门把手,激发全身控制;随后双臂需要抓住锅柄,一起将锅放入橱柜,双手也要协调好。

在研究人员来看,过去有两个主要因素阻碍了模仿学习在双臂移动操作中的广泛应用:

缺乏可访问的、即插即用的全身远程控制硬件。当然并不是说市面上没有这种硬件,而是如果购买现成的机械手,成本会很高。像 PR2 和 TIA GO 这样的机器人价格可能超过 20万美元,这让很多研究实验室无法负担。此外,要在这些平台上实现远程控制操作,还需要额外的硬件和校准。

以前的机器人学习工作没有表现出高性能的双臂移动操作复杂的任务。随着自由度的增加,手臂和基础动作之间的交互可能会变得复杂,基础姿势的微小偏差可能会导致手臂末端执行器姿势的大幅偏移。

在论文中,研究员表示,“立足于硬件和学习的角度,以前的工作还没有为双臂移动操作提供一个实用而有说服力的解决方案。”

现如今随着 AI 的发展,机器人到底可以不可以做到移动并实现协调全身去完成任务。研究人员研究了将模仿学习扩展到需要双臂移动机器人全身控制的任务可行性。

537d4544-adfd-11ee-8b88-92fbcf53809c.png

https://mobile-aloha.github.io/resources/mobile-aloha.pdf

MobileALOHA 的研发

在硬件维度,研究人员提出了 MobileALOHA,扩展了原始ALOHA的功能,这是一种低成本和全身远程控制系统,用于收集双臂移动操作数据。

在硬件设计时,研究人员主要从四个维度切入考虑:

移动速度要快:与人类的行走速度相媲美,约为 1.42 米/秒。

稳定性:在拿起沉重的家居物品时,如锅、吸尘器时,它是稳定的。

支持全身远程控制:所有的自由度可以同时远程操作,包括双臂和移动底座。

不受限制:板载电源和计算。

要想实现 MobileALOHA 的灵活性,研究员在它的下方安装了一个专为仓库设计的轮子底座——Tracer AGV,它可以承载 100kg,移动速度高达 1.6m/s,而成本只有 7000 美元。

为了使 Mobile ALOHA 不受限制,研究人员配备了一个 1.26 千瓦时的电池,重量在 14 公斤,这样还可以压住机器人,防止不平衡摔倒。此外,整个装置还包括网络摄像头和一个搭载消费级 GPU 的笔记本电脑,成本共计约为 3.2 万美元,比现成的双臂机器人便宜得多。

研究员在论文中介绍道,Mobile ALOHA 可同时遥控所有自由度。人类操作员的腰部被用物理的方式拴在系统上,并反向驱动车轮,在工作环境中驾驶系统,同时用控制器控制机器人手臂。同时,研究人员记录基本速度数据和手臂操纵数据,形成一个全身远程控制操作系统

538bfbc0-adfd-11ee-8b88-92fbcf53809c.png

这样,机器人控制系统就能同时学习动作和其他控制指令。一旦收集到足够的信息,模型就能自主地重复一系列任务。

在模仿学习方面,Mobile ALOHA 利用了 Transformer(大型语言模型中使用的架构)。最初的 ALOHA 系统使用了一种名为 Action Chunking with Transformers (ACT) 的架构,它将来自多个视点和关节位置的图像作为输入并预测一系列动作。

53972d4c-adfd-11ee-8b88-92fbcf53809c.png

MobileALOHA 将运动信号添加到输入向量中,从而扩展了该系统。这种方法可以让 Mobile ALOHA 重复使用以前的深度模仿学习算法,而只需做最小的改动。

在论文中,研究人员写道:“我们观察到,简单地将底座和手臂动作连接起来,然后通过直接模仿学习进行训练,就可以产生出色的表现。具体来说,我们将 ALOHA 的 14-DoF 关节位置与移动底座的线速度和角速度连接起来,形成 16 维动作向量。”

与此同时,研究人员汲取了近期业界在预训练和不同机器人数据集上取得的成功经验,并利用静态双臂数据集的信息,逐步提高模仿学习的性能。

在演示中,研究员展示了训练有素的机器人烹饪三道菜,并执行了一些精细的任务,例如打碎鸡蛋、切碎大蒜、倒液体、拆开蔬菜包装以及在煎锅中翻转鸡肉。

53a1a18c-adfd-11ee-8b88-92fbcf53809c.gif

此外,Mobile ALOHA 还可以执行各种家务任务,包括给植物浇水、使用真空吸尘器、装卸洗碗机、从冰箱中取出饮料、操作洗衣机。

53cd18b2-adfd-11ee-8b88-92fbcf53809c.png

53db9996-adfd-11ee-8b88-92fbcf53809c.png

研究人员表示:“通过协同训练,我们只需对每项任务进行 50 次人类演示,就能在这些任务上取得超过 80% 的成功,与没有协同训练相比,平均绝对提高了 34%。”

53eb7230-adfd-11ee-8b88-92fbcf53809c.png

Mobile ALOHA 背后的研究员

Mobile ALOHA 的到来,不仅打破了很多传统机器人的局限性,也让我们看到了这个年轻人团队为 AI 带来的无限潜力。

正如文章伊始所述,Mobile ALOHA出自斯坦福大学 3 位研究人员之手,也是华人团队。

Zipeng Fu(项目联合负责人)

Zipeng Fu,是斯坦福人工智能实验室计算机科学专业的博士生,导师是Chelsea Finn。

同时,他还是 GoogleDeepMind 的学生研究员,与Google Brain Robotics机器人运动和安全团队的技术主管经理Jie Tan一起工作。

此前,ZipengFu在加州大学洛杉矶分校完成了计算机科学与应用数学学士学位,导师是Song-Chun Zhu,后来在CMU 攻读机器学习领域的硕士,并在机器人研究所担任学生研究员,导师是 Deepak Pathak 和 Jitendra Malik。

他的研究兴趣在于机器人学、机器学习和计算机视觉的交叉领域。重点关注机器人在非结构化开放世界中的强大性能和可部署机器人系统。

Tony Z. Zhao(项目联合负责人)

Tony Z. Zhao 是斯坦福大学计算机科学博士三年级学生,导师同是 Chelsea Finn。同时,他也是 Google Deepmind 的兼职学生研究员。

此前,Tony Z. Zhao 在特斯拉自动驾驶汽车公司和 Google X Intrinsic 实习。于 2021 年获得伯克利大学电子工程科学学士学位,导师是 Sergey Levine和 Dan Klein。

“我想让机器人能够执行复杂的精细操作任务。我对初创企业和自主机器人的未来感到兴奋”,Tony Z. Zhao 写道。

Chelsea Finn(顾问)

Chelsea Finn是斯坦福大学计算机科学与电子工程系助理教授。她的实验室 IRIS 主攻研究大规模机器人交互智能,隶属于 SAIL 和ML小组。

除了教授职位之外,Chelsea Finn 在 Google 任职,是 Google Brain 团队的一员。

此前,Chelsea Finn 在加州大学伯克利分校获得了计算机科学博士学位,并在麻省理工学院获得了电子工程和计算机科学学士学位。

项目负责人现身发布翻车视频:并未做好接管世界的准备!

随着研究人员将这一项目对外公开,不少网友开始期待:「感觉我以后养老可以靠它了,现在开始攒钱,然后让机器人给我打工!」

不过,这样的幻想还没有持续多久,该项目负责人之一的 Tony Z.Zhao 紧急在 Twitter 上又发布一则视频,为 Mobile ALOHA 泼了一盆冷水。其表示,“机器人还没有准备好接管世界!我刚刚制作了一个视频,记录了在自主模式下犯下的最愚蠢的错误 Mobile ALOHA。我们还计划在休息后组织一些现场演示。敬请关注!”

在视频中,Mobile ALOHA 在自主模式下,不仅手抖,将酒杯里的水洒出来了,还让它自由落体,变成了玻璃渣:

54118c9a-adfd-11ee-8b88-92fbcf53809c.png

弄翻了锅,研究员都来不及挽救:

541da21e-adfd-11ee-8b88-92fbcf53809c.gif

Tony Z.Zhao 对此说道,「老实说,这可能是迄今为止我最喜欢的视频,当它在你面前失败时就不那么有趣了」。同时,他还向 2015 年 DARPA 机器人挑战赛、波士顿机器人失败的案例致敬。

其实,Tony Z.Zhao在Mobile ALOHA 爆火一天后选择公布“幕后花絮”,实则也是希望更多的人保持理性,减少炒作。在 AI 快速发展背后,其实也依然存在很多的不足,我们应该正确对待 AI 的发展,也要勇于面对失败,毕竟失败是成功非常重要的一个过程。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28191

    浏览量

    206478
  • AI
    AI
    +关注

    关注

    87

    文章

    30098

    浏览量

    268375
  • 模型
    +关注

    关注

    1

    文章

    3162

    浏览量

    48708

原文标题:3.2万美元造成的斯坦福双臂机器人爆红后,项目负责人亲自发翻车视频

文章出处:【微信号:AI科技大本营,微信公众号:AI科技大本营】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    原小鹏机器人设计负责人孙兆治创业项目获千万元天使轮融资

    11月5日消息,由原小鹏机器人(鹏行智能)产品设计负责人孙兆治创立的上海珞博智能科技有限公司,在年中成功完成了千万元级人民币的天使轮融资,投资方为产业相关方。
    的头像 发表于 11-05 16:30 506次阅读

    OpenAI硬件负责人热议AI基础设施扩展与节能方案

    在近日于斯坦福大学举办的Hot Chips 2024大会上,OpenAI的硬件设施负责人Trevor Cai发表了一场深入人心的演讲,其核心聚焦于“构建可扩展的AI基础设施”。Trevor Cai
    的头像 发表于 09-02 16:20 501次阅读

    国产仪器崛起:斯坦福替代方案来了!

    众所周知,斯坦福的东西一直以来,好用,贵,货期长动辄几个月,很苦恼 今天,他来了,他的替代来了 首先是最经典的型号斯坦福SR830,它的频率可以达到102.4 kHz ,18位的ADC,采样率可以
    的头像 发表于 07-10 17:05 308次阅读
    国产仪器崛起:<b class='flag-5'>斯坦福</b>替代方案来了!

    鉴智机器人完成3000万美元Pre-B轮融资

    智能驾驶领域的领军企业鉴智机器人近日宣布,成功完成了高达3000万美元的Pre-B轮融资。本轮融资由北京经开区产业升级基金和北京智能网联汽车产业基金联合领投,这两家均为亦庄国投管理的投资基金,显示出市场对鉴智机器人技术实力与商业
    的头像 发表于 05-28 11:36 629次阅读

    鉴智机器人获3000万美元Pre-B轮融资

    智能驾驶领域的领军企业鉴智机器人近日宣布,成功完成了高达3000万美元的Pre-B轮融资。本轮融资由北京经开区产业升级基金和北京智能网联汽车产业基金联合领投,这两大基金均由亦庄国投负责管理,显示出对鉴智
    的头像 发表于 05-24 09:20 475次阅读

    Rainbow Robotics开启移动双臂机器人RB-Y1预售,售价80000美元

    机器人RB-Y1的预售。 Rainbow Robotics开启移动双臂机器人RB-Y1预售,售价80000美元这是世界上第一款面向AI专家的研究平台 预售阶段,研究型
    的头像 发表于 05-09 10:58 690次阅读
    Rainbow Robotics开启移动<b class='flag-5'>双臂</b><b class='flag-5'>机器人</b>RB-Y1预售,售价80000<b class='flag-5'>美元</b>

    斯坦福AI报告:中国工业机器人领域领先全球

    在工业机器人领域,中国同样表现出色。自2013年超越日本成为全球最大的工业机器人安装国,中国与其他竞争对手的差距日益加大。2013年,中国的安装量占全球总量的20.8%;而到了2022年,这一数字已攀升至52.4%。
    的头像 发表于 04-17 16:59 720次阅读

    斯坦福、伯克利大神教授创业给机器人造大脑,OpenAI红杉抢着投5亿

    还记得曾火遍全网的ALOHA家务机器人吗?最近该项目导师,斯坦福计算机科学与电气工程系教授ChelseaFinn在X宣布,正式与其他几位伯克利大牛学者、谷歌DeepMind科学家共同创业,全力为
    的头像 发表于 04-14 08:04 135次阅读
    <b class='flag-5'>斯坦福</b>、伯克利大神教授创业给<b class='flag-5'>机器人</b>造大脑,OpenAI红杉抢着投5亿

    广和通发布基于高通高算力芯片的具身智能机器人开发平台Fibot

    3月29日,为助力机器人厂商客户快速复现及验证斯坦福Mobile ALOHA机器人的相关算法,广和通发布具身智能机器人开发平台Fibot。
    的头像 发表于 03-29 11:16 633次阅读

    广和通发布具身智能机器人开发平台Fibot

    为帮助机器人制造商更高效地复现和验证斯坦福Mobile ALOHA机器人的先进算法,广和通公司近日发布了全新的具身智能机器人开发平台——Fibot。这款平台被视为国内首款Mobile
    的头像 发表于 03-29 09:29 716次阅读

    小鹏汽车迎来新AI负责人,研发XNGP技术

    小鹏汽车近日迎来新的AI团队负责人——Cruise公司前高级资深机器学习工程师LiuXianming。他将带领小鹏AI团队研发XNGP技术,为公司的自动驾驶领域注入新的活力。
    的头像 发表于 03-26 10:43 650次阅读

    LG电子向AI机器人公司Bear Robotics注资6000万美元

    LG电子近日宣布,将向美国硅谷的初创企业Bear Robotics投资6000万美元,此举旨在加速其寻找新的增长动力。这一举措使得这家韩国消费电子巨头成为Bear Robotics的最大单一股东,彰显了LG电子对人工智能和机器人技术领域的深度布局和坚定信心。
    的头像 发表于 03-13 18:22 1547次阅读

    人形机器人火热 OpenAI入局人形机器人 英伟达等巨头入局机器人行业

    科技巨头关注。 据外媒报道英伟达、微软、OpenAI、三星、亚马逊等科技巨头大手笔投资人形机器人初创公司FigureAI,Figure计划在融资中筹集约6.75亿美元,贝佐斯计划投资1亿美元。微软将投资9,500
    的头像 发表于 02-26 17:21 747次阅读

    维修斯坦福SR560可编程滤波器烧了overload

    近日某院校送修一台斯坦福可编程滤波器SR560,客户反馈仪器烧了 overload,对仪器进行初步检测,确定与客户描述故障一致。本期将为大家分享本维修案例。 下面就是斯坦福-SR560维修情况
    的头像 发表于 01-09 15:58 416次阅读
    维修<b class='flag-5'>斯坦福</b>SR560可编程滤波器烧了overload

    超算负责人离职,特斯拉下一代自动驾驶何去何从?

    Peter Bannon 领导。特斯拉的 Dojo 项目不仅在为其自动驾驶技术提供大量的算力,也在特斯拉人形机器人 Optimus 项目开发的算力来源。   Dojo超算负责人离职  
    的头像 发表于 01-02 09:19 1458次阅读