0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

奥比中光助力机器人客户快速实现创新应用开发与量产制造

奥比中光 来源:奥比中光 2023-12-13 09:07 次阅读

是时候给大模型造个身体了。

近期,奥比中光研发团队结合机械臂与大模型,利用语音、语言、视觉-语言大模型,辅以Orbbec Gemini 2系列深度相机的数据输入,打造出一个能够理解、执行语音任务的机械臂。

该项目以斯坦福大学李飞飞教授团队打造的机器人智能体为基础,通过解决泛化、观测、控制等一系列工程化难题,将基于多模态大模型的机械臂从仿真环境落地到现实世界,拓展智能机械臂应用潜能。

融合多种大模型能力

让机械臂理解、执行语音指令

去年以来,各类大模型的涌现引发了机器人产业新一轮发展浪潮。尽管“大模型+机器人”还处于早期技术探索阶段,但随着二者深入融合,机器人有望具备更智能的“大脑”,配合更强大的“眼睛”与“身体”,实现向具身智能的进化。

奥比中光最新打造的大模型机械臂,可以通过语音Prompts作为输入,利用多种大模型的理解能力和视觉感知能力,生成空间语义信息,让机械臂理解、执行动作。

首先,机械臂可借助语音大模型,识别任务下发者的语音指令;同时,通过两台Orbbec Gemini 2双目结构光相机,获取高质量环境RGB和Depth数据;再利用SAM、CLIP等视觉-语言大模型,理解场景信息,并进行实时碰撞检测,最终执行任务。

基于这一原理,奥比中光可以让机械臂完成一系列指令,比如:

请记住当前的状态

把红色的方块放到黄色的框中

把绿色的方块放到白色的框里面

把蓝色的方块逆时针旋转30°

将蓝色方块朝着绿色方块的方向移动10cm

把蓝色方块放到绿色的方块上面

请恢复最开始的状态

请把所有的方块放到黄色的框中

目前,该项目在1.0阶段打通了多模态大模型在机械臂上的应用部署baseline。奥比中光正在进一步优化多模态指令理解、多传感器融合感知、机械臂轨迹规划控制、末端抓取控制等方面,未来将推出大模型机器人控制系统,让机器人更加智能、灵活,适应更加复杂的操作场景。

克服泛化、观测、控制难题

从仿真变为现实

目前,国内外众多针对机器人智能体的研究多在仿真环境中完成。而从虚拟仿真到真实世界,还需要克服一系列工程化落地难题。比如,在仿真环境中,相机基于理想的成像模型,可以不受成像畸变、环境光照等影响,这就对智能体在真实场景中的泛化能力提出了挑战。

奥比中光的研发团队基于预训练的多模态机械臂模型,克服了泛化、观测、控制等一系列落地难题:

为实现快速准确的语音输入与理解,引入语音预训练大模型,使得机械臂灵敏响应语音指令。

为确保机械臂在真实世界中具备足够的泛化能力,采用视觉-语言大模型,使机械臂理解适应复杂场景,在多样化的环境中稳健执行任务。

为处理预训练模型的理想相机成像问题,设计全新标定方案,优化相机自动曝光(AE)策略,解决受环境光、成像畸变、透视形变等因素带来的挑战,使机械臂拥有更强的鲁棒性。

为提高机械臂在复杂环境中的安全性,引入深度相机碰撞检测和抓取修正,优化机械臂控制,提高机械臂抓取场景的性能、精度和适应性。

基于关键技术的引入与创新,奥比中光成功地克服了多模态机械臂在多个交叉领域的难题,打通工程化应用落地的“最后一公里”。

在机器人视觉领域,奥比中光拥有超过8年的行业落地经验,服务超过100家机器人产业企业。通过多年合作,奥比中光在机器人3D传感器、激光雷达、模型算法等方面积累了丰富的经验,助力机器人客户快速实现创新应用开发与量产制造。

布局多模态视觉大模型

升维机器人应用潜力

融合多种大模型能力的机械臂,可以应用在哪些场景?

随着机器人的“眼睛”(视觉传感器)、“大脑”(大模型)、“身体”(本体)不断发展进化,智能机器人及机械臂有望在工业制造、柔性物流、商用服务等场景中率先落地。

例如,在自动化工厂场景,基于多模态大模型的机器臂可以结合无人小车,进行智能分拣、搬运;在家用服务机器人场景,人们可以通过简单的自然语言指令,让机器人帮忙倒水、取快递。

当前,面向机器人产业,奥比中光可提供单目结构光、双目结构光、iToF、激光雷达、dToF等全技术路线3D视觉传感器,并提供多传感器融合支持。同时,针对AI大模型、具身智能机器人等科技发展趋势,奥比中光正在致力于搭建机器人及AI视觉中台,通过多模态视觉大模型及智能算法的研发,结合机器人视觉传感器,将形成自主移动定位导航和避障的完整产品方案,为全产业下游客户提供全方位能力平台及系列化产品方案,迎接智能机器人时代。

审核编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28380

    浏览量

    206916
  • 3D传感器
    +关注

    关注

    4

    文章

    113

    浏览量

    26574
  • 奥比中光
    +关注

    关注

    1

    文章

    136

    浏览量

    8504
  • 大模型
    +关注

    关注

    2

    文章

    2423

    浏览量

    2641

原文标题:从仿真变成现实,奥比中光大模型机械臂1.0来了!

文章出处:【微信号:orbbec,微信公众号:奥比中光】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    与英伟达深化机器人场景合作

    光在最新互动平台动态宣布,公司与全球领先的图形处理器(GPU)制造商英伟达在机器人领域展
    的头像 发表于 08-01 17:17 951次阅读

    连获两项机器人行业殊荣

    机器人技术正以前所未有的速度重塑智能产业格局。近期,凭借在机器人与AI视觉技术
    的头像 发表于 07-19 16:49 655次阅读

    AMR机器人OEM项目首批成功下线交付

    近日,光在东莞自营工厂举办了AMR机器人OEM项目首批下线交付仪式。此次交付的AMR机器人
    的头像 发表于 07-01 10:28 593次阅读

    OpenCV携3D相机亮相CVPR 2024

    机器学习软件库,提供丰富的图像处理和计算机视觉算法。与OpenCV的深入合作,使得复杂的3D感知项目
    的头像 发表于 06-21 09:38 549次阅读

    联合英伟达,实现更高效的自主机器人导航

    5月6日-9日,光在美国芝加哥举办的北美最大自动化技术展Automate 2024亮相,带来了新一代全场景双目3D相机——Gemini 330系列,获得众多专业机器人
    的头像 发表于 05-11 09:18 732次阅读

    重磅| 全新双目系列3D相机,搭载自研芯片,为智能机器人而生

      4月29日,正式发布全新Gemini 330系列双目3D相机,首发产品包括Gemini 335、Gemini 335L两款通用型高性能双目3D相机。新品首次搭载
    发表于 04-30 18:00 457次阅读
    重磅| <b class='flag-5'>奥</b><b class='flag-5'>比</b><b class='flag-5'>中</b><b class='flag-5'>光</b>全新双目系列3D相机,搭载自研芯片,为智能<b class='flag-5'>机器人</b>而生

    政企携手走进,共话商业服务机器人新场景新增长

    4月26日,由深圳市工业和信息化局指导、深圳市机器人协会主办的深圳市“机器人+”应用推广活动之商业社区专场走进科技大厦。
    的头像 发表于 04-29 10:25 674次阅读
    政企携手走进<b class='flag-5'>奥</b><b class='flag-5'>比</b><b class='flag-5'>中</b><b class='flag-5'>光</b>,共话商业服务<b class='flag-5'>机器人</b>新场景新增长

    广东省具身智能机器人创新中心正式启动,参股

    4月16日,广东省具身智能机器人创新中心(下称“创新中心”)启动仪式在深圳南山区举行,见证人形机器人产业发展迈入新阶段。
    的头像 发表于 04-18 09:44 521次阅读

    携手新加坡LionsBot,让智能清洁机器人落地超过30个国家

    近年来,随着AI 3D视觉技术飞速发展,各类创新型自主移动机器人不断涌现。行业领先的机器人视觉与AI视觉科技公司
    的头像 发表于 04-16 09:32 579次阅读

    广和通发布基于高通高算力芯片的具身智能机器人开发平台Fibot

    3月29日,为助力机器人厂商客户快速复现及验证斯坦福Mobile ALOHA机器人的相关算法,广和通发布具身智能
    的头像 发表于 03-29 11:16 684次阅读

    迎来英特尔、微软3D相机业务重要成员

    成员、机器人及计算平台专家Brad Suessmith与Karthick Kandasamy分别出任
    的头像 发表于 03-26 09:37 441次阅读

    3D相机及方案亮相,携手NVIDIA探索机器人应用革新

    3月18日-21日,作为英伟达NPN合作伙伴亮相NVIDIA GTC 2024 AI开发者大会,在美国加州圣何塞会议中心带来基于
    的头像 发表于 03-22 09:37 355次阅读

    3D相机及方案亮相,携手NVIDIA探索机器人应用革新

    3月18日-22日,作为英伟达NPN合作伙伴亮相NVIDIA GTC 2024 AI开发者大会,在美国加州圣何塞会议中心带来基于
    的头像 发表于 03-19 17:20 658次阅读

    机器视觉运动控制一体机在伏汇流焊机器人系统的解决方案

    生产线的柔性和自动化水平。此外,我们的解决方案通过降低废品率有效减少能源消耗,助力实现环保和可持续发展目标。借助我们高度集成的硬件和易用的RTFuse机器人系统平台,让客户享受到
    发表于 02-28 15:01

    TRIZ在智能机器人开发创新之旅

    随着科技的飞速发展,智能机器人已成为现代社会的热门话题。而在这场技术革命的浪潮,TRIZ理论正以其独特的创新思维方法,为智能机器人开发
    的头像 发表于 02-22 10:24 642次阅读