谷歌借助Gemini AI系统深化对机器人的训练-电子发烧友网

7月12日，国际科技界传来新动态，谷歌正借助其先进的Gemini AI系统，深化对旗下机器人的训练，旨在显著提升它们的导航能力和任务执行能力。DeepMind机器人团队最新发布的研究论文，详细阐述了如何利用Gemini 1.5 Pro的强化长上下文窗口功能，极大地优化了用户通过自然语言指令与RT-2机器人交互的体验。

这一创新技术的核心在于，机器人首先通过拍摄并分析家庭或办公室等指定区域的视频，利用Gemini 1.5 Pro的强大能力来“学习”并理解其所在环境。随后，机器人能够基于这些视觉信息，灵活运用语音和/或图像反馈，执行用户的复杂指令。例如，当用户询问“我在哪里可以给手机充电？”时，机器人能迅速识别环境，并引导用户至最近的电源插座。

据DeepMind透露，在覆盖超过9，000平方英尺的测试区域内，这些由Gemini驱动的机器人成功响应并完成了50多项不同用户指令，成功率高达90%，展现了极高的准确性和效率。

更令人振奋的是，初步研究还揭示了Gemini 1.5 Pro赋予机器人的额外能力——即除了精准导航外，还能规划并执行更为复杂的任务指令。例如，面对询问是否有特定饮料的用户，机器人能够自主决定前往冰箱检查，随后返回并报告结果，这一连串动作展现了其强大的决策与执行能力。

尽管在视频演示中，机器人对每条指令的迅速确认给人留下了深刻印象，但研究报告也诚实地指出了背后隐藏的“秘密”——处理这些复杂指令实际上需要10至30秒的时间。这表明，尽管技术进步显著，但实现完全无缝的人机交互仍需时日。

不过，这一系列的进展无疑为我们描绘了一幅未来生活的美好图景：或许不久的将来，我们就能与这些高度智能化的机器人共享家园，让它们帮助我们找到遗失的钥匙、钱包，甚至是执行更多日常生活中的琐碎任务，极大地提升生活的便捷性与舒适度。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
212

文章
29034

浏览量
210148
谷歌

谷歌

+关注

关注
27

文章
6215

浏览量
106741
AI

AI

+关注

关注
87

文章
32919

浏览量
272551

谷歌Gemini AI目标年底用户达5亿

即将在AI市场掀起新的波澜。据悉，谷歌的目标是在今年年底前，让全球有5亿人使用基于Gemini AI技术构建的聊天

发表于 01-18 11:30 •700次阅读

谷歌CEO：Gemini AI技术超越竞品，目标年底5亿用户

使用基于Gemini技术构建的聊天机器人。这一数字显示了谷歌对于Gemini技术的期望和信心，同时也反映出了他们对于市场潜力的乐观估计。然而，谷歌

发表于 01-17 10:37 •350次阅读

【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

具身智能机器人的基础模块，这个是本书的第二部分内容，主要分为四个部分：机器人计算系统，自主机器人的感知系统，自主

发表于 01-04 19:22

《具身智能机器人系统》第10-13章阅读心得之具身智能机器人计算挑战

阅读《具身智能机器人系统》第10-13章，我对具身智能机器人的工程实践有了全新认识。第10章从实时性角度剖析了机器人计算加速问题。机器人定位

发表于 01-04 01:15

NVIDIA技术推动机器人仿真

借助机器人仿真，开发人员能够在基于物理学的现实世界数字呈现中对机器人进行虚拟训练、测试和验证。

发表于 01-03 14:10 •324次阅读

【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

，能够利用\"思维链\"的技术将复杂任务分解为多个子任务，以渐进的方式解决问题。这不仅提高了任务的成功率，也显著增强了系统的鲁棒性，使得机器人可以更高效地应对复杂环境和多样化需求

发表于 12-29 23:04

【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

100 倍。此外，Sim2Real 技术的进步也促进了技能与知识从模拟环境到实际应用的转移。这项技术在虚拟空间中训练机器人和 AI 系统，使它们能够安全有效地学习任务，而不受现实世

发表于 12-24 00:33

《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

、谷歌的RT系列等前沿产品中展露锋芒。这些突破性成果标志着AI正从虚拟世界迈向物理世界的深度交互。而研读《具身智能机器人系统》前六章，我对具身智能(Embodied Artifici

发表于 12-19 22:26

谷歌发布“深度研究”AI工具，利用Gemini模型进行网络信息检索

据外媒最新报道，谷歌近期发布了一款名为“深度研究”的先进AI工具。这款工具借助其内部的Gemini大型语言模型，实现了对网络信息的高效检索与深度挖掘，进一步满足了用户对精准、详尽信息的

发表于 12-16 09:35 •449次阅读

谷歌发布Gemini 2.0 AI模型

谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名为“深度研究”的新特性，旨在为用户提供更加全面和深入的复杂主题探索与报告撰写辅助。 Gemini 2.0通过高

发表于 12-12 10:13 •463次阅读

Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统

迈新步，为其机器人出租车业务引入了一种基于谷歌多模态大语言模型（MLLM）“Gemini”的全新训练模型——“端到端多模态自动驾驶模型”（EMMA）。

发表于 10-31 16:55 •1391次阅读

利用NVIDIA技术推动下一代AI机器人发展

从人形机器人到工厂，基于物理 AI 的工业系统正在通过训练、仿真和推理加速发展。

发表于 10-27 09:54 •444次阅读

Snapchat聊天机器人集成谷歌Gemini技术

Snap与谷歌云的战略合作再升级，为Snapchat平台注入了新的智能活力。双方宣布，Snapchat的My AI聊天机器人将深度集成谷歌Gemin

发表于 09-25 14:51 •393次阅读

英伟达打造人形机器人训练平台，引领AI新纪元

英伟达近日宣布了一项重大举措，为全球机器人制造业与AI领域注入强劲动力。公司推出了专为人形机器人设计的训练平台，旨在为行业领先的制造商、AI

发表于 08-05 11:45 •939次阅读

Al大模型机器人

理解能力强大: AI大模型机器人可以理解和生成自然语言，能够进行复杂的对话和语言任务。它们能够识别语言中的语义、语境和情感，并据此作出适当的回应。广泛的知识储备: 这些模型基于大规模的数据集进行训练，拥有

发表于 07-05 08:52

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

谷歌借助Gemini AI系统深化对机器人的训练

评论

谷歌Gemini AI目标年底用户达5亿

谷歌CEO：Gemini AI技术超越竞品，目标年底5亿用户

【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

《具身智能机器人系统》第10-13章阅读心得之具身智能机器人计算挑战

NVIDIA技术推动机器人仿真

【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

谷歌发布“深度研究”AI工具，利用Gemini模型进行网络信息检索

谷歌发布Gemini 2.0 AI模型

Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统

利用NVIDIA技术推动下一代AI机器人发展

Snapchat聊天机器人集成谷歌Gemini技术

英伟达打造人形机器人训练平台，引领AI新纪元

Al大模型机器人