0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌借助Gemini AI系统深化对机器人的训练

要长高 2024-07-12 16:29 次阅读

7月12日,国际科技界传来新动态,谷歌正借助其先进的Gemini AI系统,深化对旗下机器人的训练,旨在显著提升它们的导航能力和任务执行能力。DeepMind机器人团队最新发布的研究论文,详细阐述了如何利用Gemini 1.5 Pro的强化长上下文窗口功能,极大地优化了用户通过自然语言指令与RT-2机器人交互的体验。

这一创新技术的核心在于,机器人首先通过拍摄并分析家庭或办公室等指定区域的视频,利用Gemini 1.5 Pro的强大能力来“学习”并理解其所在环境。随后,机器人能够基于这些视觉信息,灵活运用语音和/或图像反馈,执行用户的复杂指令。例如,当用户询问“我在哪里可以给手机充电?”时,机器人能迅速识别环境,并引导用户至最近的电源插座。

据DeepMind透露,在覆盖超过9,000平方英尺的测试区域内,这些由Gemini驱动的机器人成功响应并完成了50多项不同用户指令,成功率高达90%,展现了极高的准确性和效率。

更令人振奋的是,初步研究还揭示了Gemini 1.5 Pro赋予机器人的额外能力——即除了精准导航外,还能规划并执行更为复杂的任务指令。例如,面对询问是否有特定饮料的用户,机器人能够自主决定前往冰箱检查,随后返回并报告结果,这一连串动作展现了其强大的决策与执行能力。

尽管在视频演示中,机器人对每条指令的迅速确认给人留下了深刻印象,但研究报告也诚实地指出了背后隐藏的“秘密”——处理这些复杂指令实际上需要10至30秒的时间。这表明,尽管技术进步显著,但实现完全无缝的人机交互仍需时日。

不过,这一系列的进展无疑为我们描绘了一幅未来生活的美好图景:或许不久的将来,我们就能与这些高度智能化的机器人共享家园,让它们帮助我们找到遗失的钥匙、钱包,甚至是执行更多日常生活中的琐碎任务,极大地提升生活的便捷性与舒适度。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28151

    浏览量

    206091
  • 谷歌
    +关注

    关注

    27

    文章

    6128

    浏览量

    105030
  • AI
    AI
    +关注

    关注

    87

    文章

    29945

    浏览量

    268245
收藏 人收藏

    评论

    相关推荐

    【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮!

    情况为例,具身智能机器人的核心元器件(包括 3D 视觉传感器、六维力传感器、微型传动系统、灵巧手与精密力控系统、高性能 驱控关节模组、融合通用大模型、机器人算力底座
    发表于 11-11 10:20

    Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统

    迈新步,为其机器人出租车业务引入了一种基于谷歌多模态大语言模型(MLLM)“Gemini”的全新训练模型——“端到端多模态自动驾驶模型”(EMMA)。
    的头像 发表于 10-31 16:55 922次阅读

    利用NVIDIA技术推动下一代AI机器人发展

    从人形机器人到工厂,基于物理 AI 的工业系统正在通过训练、仿真和推理加速发展。
    的头像 发表于 10-27 09:54 197次阅读

    Snapchat聊天机器人集成谷歌Gemini技术

    Snap与谷歌云的战略合作再升级,为Snapchat平台注入了新的智能活力。双方宣布,Snapchat的My AI聊天机器人将深度集成谷歌Gemin
    的头像 发表于 09-25 14:51 239次阅读

    英伟达打造人形机器人训练平台,引领AI新纪元

    英伟达近日宣布了一项重大举措,为全球机器人制造业与AI领域注入强劲动力。公司推出了专为人形机器人设计的训练平台,旨在为行业领先的制造商、AI
    的头像 发表于 08-05 11:45 667次阅读

    Al大模型机器人

    理解能力强大: AI大模型机器人可以理解和生成自然语言,能够进行复杂的对话和语言任务。它们能够识别语言中的语义、语境和情感,并据此作出适当的回应。广泛的知识储备: 这些模型基于大规模的数据集进行训练,拥有
    发表于 07-05 08:52

    谷歌计划推出明星网红AI聊天机器人,与Meta展开技术竞争

    在科技界风起云涌的当下,谷歌再次凭借其前瞻性的战略布局和创新能力,成为了公众关注的焦点。据The Information的独家爆料,谷歌正秘密研发一款全新的AI聊天机器人,该
    的头像 发表于 06-26 18:23 993次阅读

    谷歌Gmail将支持Gemini总结电子邮件内容

    谷歌透露,Gemini 将协助 Workspace 和 Google One AI Premium 的用户理解和处理电子邮件内容。用户可通过移动应用和网页版 Gmail 使用 Gemini
    的头像 发表于 05-15 11:11 557次阅读

    Chrome地址栏添Gemini快捷聊谷歌AI机器人Gem

    这一功能已在Chrome浏览器Canary测试版中试行,实现的方法为在地址栏下拉菜单底部显示提示语“输入@geminiGemini聊天”。
    的头像 发表于 04-17 15:17 689次阅读

    谷歌升级Bard AI聊天机器人Gemini,新增Python代码编辑功能

     此外,谷歌表示,接下来数个月内,Gemini Advanced 计划会加入更多新功能,如支持更为详尽的上下文信息、增强多模态交互性以及完善编程功能。据谷歌公开更新,付费用户可用 Gemini
    的头像 发表于 02-20 15:47 533次阅读

    谷歌AI聊天机器人改名为Gemini

    谷歌(Google)近日宣布,旗下备受瞩目的AI聊天机器人Bard正式更名为Gemini,并推出了一款功能更加强大的付费版本——Gemini
    的头像 发表于 02-18 11:28 1033次阅读

    机器人拥抱AI大模型已成共识!

    目前普遍的共识是,机器人拥抱AI大模型的过程就是具身智能机器人的实现过程,融合AI大模型的具身智能机器人将是未来
    发表于 12-22 17:08 363次阅读

    新火种AI | 谷歌Gemini“抄袭”百度文心一言?AI训练数据陷难题

    谷歌自己放出“实锤”,Gemini化身百度文心大模型?
    的头像 发表于 12-20 09:09 472次阅读
    新火种<b class='flag-5'>AI</b> | <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>“抄袭”百度文心一言?<b class='flag-5'>AI</b><b class='flag-5'>训练</b>数据陷难题

    Gemini AI演示视频完全真实,为“简洁”而缩短部分内容

    此外,萧茜茜透露,Gemini模型将持续改进谷歌搜索及Bard聊天机器人功能。同时,她指出Bard无疑已经成为市场上“最热切公认的”免费聊天机器人之一。
    的头像 发表于 12-14 10:22 511次阅读

    谷歌揭秘Gemini,AMD对峙英伟达

    今天,我们看到谷歌揭开了多模态AI模型Gemini的神秘面纱,AMD挑战英伟达在AI芯片市场的霸主地位,微软在英国AI领域的巨额投资,以及3
    的头像 发表于 12-07 20:05 701次阅读