0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌借助Gemini AI系统深化对机器人的训练

要长高 2024-07-12 16:29 次阅读

7月12日,国际科技界传来新动态,谷歌正借助其先进的Gemini AI系统,深化对旗下机器人的训练,旨在显著提升它们的导航能力和任务执行能力。DeepMind机器人团队最新发布的研究论文,详细阐述了如何利用Gemini 1.5 Pro的强化长上下文窗口功能,极大地优化了用户通过自然语言指令与RT-2机器人交互的体验。

这一创新技术的核心在于,机器人首先通过拍摄并分析家庭或办公室等指定区域的视频,利用Gemini 1.5 Pro的强大能力来“学习”并理解其所在环境。随后,机器人能够基于这些视觉信息,灵活运用语音和/或图像反馈,执行用户的复杂指令。例如,当用户询问“我在哪里可以给手机充电?”时,机器人能迅速识别环境,并引导用户至最近的电源插座。

据DeepMind透露,在覆盖超过9,000平方英尺的测试区域内,这些由Gemini驱动的机器人成功响应并完成了50多项不同用户指令,成功率高达90%,展现了极高的准确性和效率。

更令人振奋的是,初步研究还揭示了Gemini 1.5 Pro赋予机器人的额外能力——即除了精准导航外,还能规划并执行更为复杂的任务指令。例如,面对询问是否有特定饮料的用户,机器人能够自主决定前往冰箱检查,随后返回并报告结果,这一连串动作展现了其强大的决策与执行能力。

尽管在视频演示中,机器人对每条指令的迅速确认给人留下了深刻印象,但研究报告也诚实地指出了背后隐藏的“秘密”——处理这些复杂指令实际上需要10至30秒的时间。这表明,尽管技术进步显著,但实现完全无缝的人机交互仍需时日。

不过,这一系列的进展无疑为我们描绘了一幅未来生活的美好图景:或许不久的将来,我们就能与这些高度智能化的机器人共享家园,让它们帮助我们找到遗失的钥匙、钱包,甚至是执行更多日常生活中的琐碎任务,极大地提升生活的便捷性与舒适度。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28578

    浏览量

    207794
  • 谷歌
    +关注

    关注

    27

    文章

    6179

    浏览量

    105727
  • AI
    AI
    +关注

    关注

    87

    文章

    31335

    浏览量

    269715
收藏 人收藏

    评论

    相关推荐

    谷歌Gemini AI目标年底用户达5亿

    即将在AI市场掀起新的波澜。 据悉,谷歌的目标是在今年年底前,让全球有5亿使用基于Gemini AI技术构建的聊天
    的头像 发表于 01-18 11:30 247次阅读

    谷歌CEO:Gemini AI技术超越竞品,目标年底5亿用户

    使用基于Gemini技术构建的聊天机器人。这一数字显示了谷歌对于Gemini技术的期望和信心,同时也反映出了他们对于市场潜力的乐观估计。 然而,谷歌
    的头像 发表于 01-17 10:37 96次阅读

    【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

    具身智能机器人的基础模块,这个是本书的第二部分内容,主要分为四个部分:机器人计算系统,自主机器人的感知系统,自主
    发表于 01-04 19:22

    《具身智能机器人系统》第10-13章阅读心得之具身智能机器人计算挑战

    阅读《具身智能机器人系统》第10-13章,我对具身智能机器人的工程实践有了全新认识。第10章从实时性角度剖析了机器人计算加速问题。机器人定位
    发表于 01-04 01:15

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    ,能够利用\"思维链\"的技术将复杂任务分解为多个子任务,以渐进的方式解决问题。这不仅提高了任务的成功率,也显著增强了系统的鲁棒性,使得机器人可以更高效地应对复杂环境和多样化需求
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    100 倍 。此外,Sim2Real 技术的进步也促进了技能与知识从模拟环境到实际应用的转移。这项技术在虚拟空间中训练机器人AI 系统,使它们能够安全有效地学习任务,而不受现实世
    发表于 12-24 00:33

    《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

    谷歌的RT系列等前沿产品中展露锋芒。这些突破性成果标志着AI正从虚拟世界迈向物理世界的深度交互。 而研读《具身智能机器人系统》前六章,我对具身智能(Embodied Artifici
    发表于 12-19 22:26

    谷歌发布“深度研究”AI工具,利用Gemini模型进行网络信息检索

    据外媒最新报道,谷歌近期发布了一款名为“深度研究”的先进AI工具。这款工具借助其内部的Gemini大型语言模型,实现了对网络信息的高效检索与深度挖掘,进一步满足了用户对精准、详尽信息的
    的头像 发表于 12-16 09:35 251次阅读

    谷歌发布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名为“深度研究”的新特性,旨在为用户提供更加全面和深入的复杂主题探索与报告撰写辅助。 Gemini 2.0通过高
    的头像 发表于 12-12 10:13 276次阅读

    Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统

    迈新步,为其机器人出租车业务引入了一种基于谷歌多模态大语言模型(MLLM)“Gemini”的全新训练模型——“端到端多模态自动驾驶模型”(EMMA)。
    的头像 发表于 10-31 16:55 1127次阅读

    利用NVIDIA技术推动下一代AI机器人发展

    从人形机器人到工厂,基于物理 AI 的工业系统正在通过训练、仿真和推理加速发展。
    的头像 发表于 10-27 09:54 291次阅读

    Snapchat聊天机器人集成谷歌Gemini技术

    Snap与谷歌云的战略合作再升级,为Snapchat平台注入了新的智能活力。双方宣布,Snapchat的My AI聊天机器人将深度集成谷歌Gemin
    的头像 发表于 09-25 14:51 306次阅读

    英伟达打造人形机器人训练平台,引领AI新纪元

    英伟达近日宣布了一项重大举措,为全球机器人制造业与AI领域注入强劲动力。公司推出了专为人形机器人设计的训练平台,旨在为行业领先的制造商、AI
    的头像 发表于 08-05 11:45 772次阅读

    Al大模型机器人

    理解能力强大: AI大模型机器人可以理解和生成自然语言,能够进行复杂的对话和语言任务。它们能够识别语言中的语义、语境和情感,并据此作出适当的回应。广泛的知识储备: 这些模型基于大规模的数据集进行训练,拥有
    发表于 07-05 08:52

    谷歌AI聊天机器人改名为Gemini

    谷歌(Google)近日宣布,旗下备受瞩目的AI聊天机器人Bard正式更名为Gemini,并推出了一款功能更加强大的付费版本——Gemini
    的头像 发表于 02-18 11:28 1158次阅读