Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统-电子发烧友网

10月31日讯，自动驾驶领域的先锋Waymo，作为Alphabet旗下的一员，长久以来将其与谷歌DeepMind的紧密合作及深厚的AI研究底蕴视为其在自动驾驶竞赛中脱颖而出的关键。如今，Waymo再迈新步，为其机器人出租车业务引入了一种基于谷歌多模态大语言模型（MLLM）“Gemini”的全新训练模型——“端到端多模态自动驾驶模型”（EMMA）。

Waymo最新发布的研究论文揭示了EMMA模型的面纱。这一创新的端到端训练模型能够解析传感器数据，预测“自动驾驶车辆的未来行驶轨迹”，从而辅助Waymo的无人驾驶车辆做出精准决策，无论是选择行进路线还是规避障碍物。

尤为引人注目的是，这是自动驾驶领军企业首次公开表示计划将MLLM技术融入其核心业务，预示着MLLM的应用范围或将超越聊天机器人、邮件整理及图像生成等传统领域，向自动驾驶这一前沿阵地拓展。

传统自动驾驶系统往往采用模块化设计，针对感知、地图构建、预测及规划等特定功能分别开发。尽管这种模式在过去取得了显著成效，但Waymo指出，其存在可扩展性问题，模块间的误差累积和通信限制影响了整体性能，且面对新环境时适应性不强。

Waymo认为，像Gemini这样的MLLM能够有效解决上述问题。它们作为互联网大数据培育的“通才”，拥有超越常规驾驶经验的广泛“世界知识”，并通过“链式推理”等先进技术展现出强大的逻辑推理能力，能够模仿人类思维，将复杂任务分解为逻辑步骤。

据Waymo介绍，EMMA模型在应对复杂交通环境时表现出色，如动物穿越道路或道路施工等情况，都能为无人驾驶汽车规划出合理的行驶路径。

值得注意的是，特斯拉等竞争对手也在积极开发自动驾驶汽车的端到端模型。特斯拉CEO埃隆·马斯克曾宣称，其最新版本的FSD 12.5.5采用了“端到端神经网络”AI系统，直接将摄像头图像转化为驾驶决策。

尽管Waymo在部署无人驾驶车辆方面领先于特斯拉，但它同样对端到端系统抱有浓厚兴趣。Waymo表示，其EMMA模型在轨迹预测、物体识别和道路理解方面取得了优异成绩。

然而，EMMA也面临挑战。Waymo承认，在将模型投入实际应用前，还需克服一些障碍，如EMMA目前无法整合来自激光雷达或雷达的3D传感器输入，原因是“计算成本过高”，且仅能处理有限数量的图像帧。

此外，研究论文中未提及的一个潜在风险是，像Gemini这样的MLLM可能会产生“幻觉”，这对于容错率极低的无人驾驶汽车而言是极大的挑战。因此，在MLLM能够大规模应用于自动驾驶之前，仍需开展更多深入研究。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6171

浏览量
105494
自动驾驶

自动驾驶

+关注

关注
784

文章
13839

浏览量
166550
waymo

waymo

+关注

关注
2

文章
312

浏览量
24687

端到端自动驾驶技术研究与分析

传递和全局优化的优势，成为智能驾驶技术发展的重要方向。与传统模块化架构相比，端到端技术通过深度神经网络实现从传感器数据输入到车辆控制信号输出

发表于 12-19 13:07 •214次阅读

连接视觉语言大模型与端到端自动驾驶

端到端自动驾驶在大规模驾驶数据上训练，展现出很强的决策规划能力，但是面对复杂罕见的驾驶场景，依然

发表于 11-07 15:15 •264次阅读

连接视觉语言大<b class='flag-5'>模型</b>与<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>

Waymo估值超450亿美元,自动驾驶领域再掀波澜

在科技巨头纷纷布局自动驾驶技术的今天，谷歌母公司Alphabet旗下的自动驾驶部门Waymo再次成为了业界的焦点。据外媒最新报道，包括最新一轮融资在内，

发表于 11-01 15:26 •1034次阅读

Waymo获56亿美元融资，加速自动驾驶服务扩张

谷歌母公司Alphabet旗下的无人驾驶汽车部门Waymo成功完成了一轮高达56亿美元的融资。这笔资金将主要用于推动Waymo自动驾驶出租车

发表于 10-28 15:52 •257次阅读

Mobileye端到端自动驾驶解决方案的深度解析

强大的技术优势。 Mobileye的端到端解决方案概述 1.1 什么是端到端

发表于 10-17 09:35 •383次阅读

Mobileye<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>解决方案的深度解析

实现自动驾驶，唯有端到端？

，去年行业主流方案还是轻高精地图城区智驾，今年大家的目标都瞄到了端到端（End-to-End, E2E）。端到

发表于 08-12 09:14 •756次阅读

实现<b class='flag-5'>自动驾驶</b>，唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>？

FPGA在自动驾驶领域有哪些优势?

可以根据自动驾驶系统的具体需求，通过编程来配置FPGA的逻辑功能和连接关系，以适应不同的应用场景和算法变化。这种灵活性使得FPGA能够快速适应自动驾驶技术的快速发展和变化。低延迟： 自动驾

发表于 07-29 17:11

FPGA在自动驾驶领域有哪些应用？

是FPGA在自动驾驶领域的主要应用：一、感知算法加速图像处理：自动驾驶中需要通过摄像头获取并识别道路信息和行驶环境，这涉及到大量的图像处理任务。FPGA在处理图像上的运算速度快，可并行性强，且功耗

发表于 07-29 17:09

Alphabet向旗下自动驾驶企业Waymo注资50亿美元

7月24日，科技巨头谷歌的母公司Alphabet宣布了一项重大投资决策，即向旗下自动驾驶领域的先锋企业Waymo注资50亿美元，此举标志着Alphabet对自动驾驶技术未来发展的坚定承

发表于 07-24 16:13 •1335次阅读

理想汽车加速自动驾驶布局，成立“端到端”实体组织

近期，理想汽车在其智能驾驶领域迈出了重要一步，正式成立了专注于“端到端自动驾驶”的实体组织，该组织规模超过200人，标志着理想在

发表于 07-17 15:42 •1358次阅读

智行者联合清华完成国内首套全栈式端到端自动驾驶系统的开放道路测试

近日，智行者与清华大学车辆学院李克强院士、李升波教授领导的研究团队，完成了国内首套全栈式端到端自动驾驶系统的开放道路测试。

发表于 04-22 09:24 •795次阅读

佐思汽研发布《2024年端到端自动驾驶研究报告》

端到端自动驾驶是直接从传感器信息输入（如摄像头图像、LiDAR等）到控制命令输出（如转向、加减速等）映射的一套

发表于 04-20 11:21 •3302次阅读

理想汽车自动驾驶端到端模型实现

理想汽车在感知、跟踪、预测、决策和规划等方面都进行了模型化，最终实现了端到端的模型。这种模型不仅

发表于 04-12 12:17 •466次阅读

未来已来，多传感器融合感知是自动驾驶破局的关键

巨大的进展；自动驾驶开始摒弃手动编码规则和机器学习模型的方法，转向全面采用端到端的神经网络AI系统

发表于 04-11 10:26

Waymo自愿召回444辆自动驾驶汽车 L4的自动驾驶还有很多路要走

近日，谷歌旗下的自动驾驶部门Waymo自愿召回了444辆自动驾驶汽车，原因是其软件可能无法准确预测拖曳车辆的运动轨迹

发表于 02-26 10:22 •1209次阅读