佐思汽研发布《2024年端到端自动驾驶研究报告》-电子发烧友网

佐思汽研发布《2024年端到端自动驾驶研究报告》。

国内端到端方案现状

端到端自动驾驶是直接从传感器信息输入（如摄像头图像、LiDAR等）到控制命令输出（如转向、加减速等）映射的一套系统，最早出现在1988年的ALVINN项目，通过相机和激光测距仪进行输入和一个简单的神经网络生成的转向进行输出。

2024年初，特斯拉FSD V12.3版本发布，智驾水平让人惊艳，端到端自动驾驶方案受到国内主机厂和自动驾驶方案企业的广泛关注。

与传统的多模块方案相比，端到端自动驾驶方案将感知、预测和规划整合到单一模型中，简化了方案结构，可模拟人类驾驶员直接从视觉输入做出驾驶决策，以数据和算力为主导，能够有效解决模块化方案的长尾场景，提升模型的训练效率和性能上限。

传统多模块方案与端到端方案的对比（部分）

来源：佐思汽研《2024年端到端自动驾驶研究报告》

FSD V12.3版本实测图

来源：公开渠道

部分主机厂对端到端方案落地量产的规划

来源：佐思汽研《2024年端到端自动驾驶研究报告》

理想端到端方案

理想认为，完整的端到端需要完成感知、跟踪、预测、决策、规划整个过程的模型化，是实现L3级别自动驾驶的最佳方案。2023年，理想推送AD Max3.0，其整体框架已经具备端到端的理念，但距离完整的端到端尚有一定差距，2024年理想预计以此为基础，推进该系统成为一个彻底的端到端方案。

理想构建的自动驾驶框架如下图，分为两个系统：

快系统：System1，感知周围环境后直接执行，为理想现行的端到端方案。

慢系统：System2，多模态大语言模型，针对未知环境进行逻辑思考与探索，以解决L4未知场景下的问题。

理想自动驾驶框架

来源：理想汽车

在端到端方案推进的过程中，理想计划把规划/预测模型与感知模型进行统一，并在原基础上完成Temporal Planner的端到端，实现泊车/行车一体化。

数据成为端到端落地的关键

端到端方案的落地需要经历构建研发团队、配置硬件设施、数据收集处理、算法训练与策略定制、验证评估、推广量产等流程，部分场景痛点如表中所示：

端到端方案的部分场景痛点

来源：佐思汽研《2024年端到端自动驾驶研究报告》

其中，端到端自动驾驶方案中的一体化训练需要大量的数据，因此其面临的难点之一在于数据的收集和处理。

首先，数据的收集需要大量的时间和渠道，数据类型除了驾驶数据外还包括各种不同的道路、天气和交通情况等场景数据，其中在实际驾驶中驾驶员前方视野的驾驶数据相对便于收集，周围方位的信息收集则难以保证。

再次，数据处理时需要设计数据提取维度、从海量的视频片段中提取有效的特征、统计数据分布等，以支持大规模的数据训练。

元戎启行

截至2024年3月，元戎启行端到端自动驾驶方案已经获得长城汽车的定点项目，并与英伟达开展合作，预计2025年适配英伟达Thor芯片；在元戎启行的规划中，从传统方案过渡到“端到端”自动驾驶方案，经历传感器前融合、去高精度地图、感知决策控制三个模型一体化等环节。

元戎启行在数据环节的布局

来源：佐思汽研《2024年端到端自动驾驶研究报告》

极佳科技

极佳科技的自动驾驶世界模型DriveDreamer，具备场景生成、数据生成、驾驶动作预测等功能；在场景/数据生成上，分为两个步骤：

涉及单帧结构化条件，引导DriveDreamer生成驾驶场景图像，便于其理解结构交通约束。

将其理解扩展到视频生成。利用连续的交通结构条件，DriveDreamer输出驾驶场景视频，进一步增强其对运动转换的理解。

DriveDreamer的功能包括可连续驾驶视频生成、与文本提示和结构化交通限制无缝对齐

来源：极佳科技

端到端方案加快具身机器人落地

除了自动驾驶汽车，具身机器人是端到端方案另一个主流场景。从端到端自动驾驶到机器人，需要构建更加通用的世界模型，来适应更加复杂、多元的现实使用场景，主流AGI（通用人工智能）发展的框架分为两个阶段：

阶段一：基础大模型理解和生成实现统一，进一步与具身智能结合，形成统一世界模型；

阶段二：世界模型+复杂任务的规控能力和抽象概念的归纳能力，逐步演化进入交互AGI 1.0时代。

在世界模型落地的过程中，构建端到端的VLA（Vision-Language-Ac tion) 自主系统成为关键一环。VLA作为具身智能基础大模型，能够将3D感知、推理和行动无缝链接起来，形成一个生成式世界模型，并建立在基于3D的大型语言模型（LLM）之上，引入一组交互标记以与环境进行互动。

3D-VLA解决方案

来源：University of Massachusetts Amherst、MIT-IBM Watson AI Lab等机构

截至2024年4月，部分采用端到端方案的具身机器人厂商如下：

部分具身机器人如何应用端到端方案

来源：佐思汽研《2024年端到端自动驾驶研究报告》

以有鹿机器人为例，其具身智能大模型LPLM（Large Physical Language Model）为端到端的具身智能解决方案，通过自我标注机制提升模型从未标注数据中的学习效率和质量，从而加深对世界的理解，进而加强机器人的泛化能力与跨模态、跨场景、跨行业场景下的环境适应性。

LPLM模型架构

来源：有鹿机器人

LPLM 将物理世界抽象化，确保该类信息与 LLM 里特征的抽象等级对齐，将物理世界中每一个所指的实体显式建模为 token，编码几何、语义、运动学与意图信息。

此外，LPLM 在自然语言指令的编码中加入了 3D grounding，一定程度上弥补了自然语言不够精确的缺陷；其解码器能够通过不断预测未来的方式去学习，从而加强了模型从海量无标签数据中学习的能力。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

传感器

传感器

+关注

关注
2552

文章
51341

浏览量
755515
神经网络

神经网络

+关注

关注
42

文章
4777

浏览量
100995
摄像头

摄像头

+关注

关注
60

文章
4859

浏览量
96053
英伟达

英伟达

+关注

关注
22

文章
3827

浏览量
91608
自动驾驶

自动驾驶

+关注

关注
784

文章
13910

浏览量
166760

原文标题：端到端智驾研究：E2E自动驾驶发展现状

文章出处：【微信号：zuosiqiche，微信公众号：佐思汽车研究】欢迎添加关注！文章转载请注明出处。

2024年自动驾驶行业热点技术盘点

自动驾驶技术日新月异，每一年都会有新的突破。2024年的自动驾驶，更是出现了许多新的技术路线，其中包括城市NOA（Navigate on A

发表于 01-14 10:48 •193次阅读

自动驾驶域控研究:One board/One Chip方案将对汽车供应链产生深远影响

佐思汽研发布了《2024-2025年自动驾驶域控制器

发表于 12-30 11:38 •853次阅读

<b class='flag-5'>自动驾驶</b>域控<b class='flag-5'>研究</b>:One board/One Chip方案将对汽车供应链产生深远影响

端到端自动驾驶技术研究与分析

编者语：「智驾最前沿」微信公众号后台回复：C-0450，获取本文参考报告：《端到端自动驾驶行业研究报告

发表于 12-19 13:07 •277次阅读

端到端在自动泊车的应用

与城市环境的复杂性和高速公路驾驶的风险相比，停车场景的特点是低速、空间有限和高可控性。这些特点为在车辆中逐步部署端到端自动驾驶能力提供了可行

发表于 12-18 11:38 •432次阅读

爆火的端到端如何加速智驾落地？

编者语：「智驾最前沿」微信公众号后台回复：C-0551，获取本文参考报告：《智能汽车端到端技术研究报告》pdf下载方式。 “

发表于 11-26 13:17 •356次阅读

连接视觉语言大模型与端到端自动驾驶

端到端自动驾驶在大规模驾驶数据上训练，展现出很强的决策规划能力，但是面对复杂罕见的驾驶场景，依然

发表于 11-07 15:15 •304次阅读

Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统

迈新步，为其机器人出租车业务引入了一种基于谷歌多模态大语言模型（MLLM）“Gemini”的全新训练模型——“端到端多模态自动驾驶模型”（EMMA）。

发表于 10-31 16:55 •1132次阅读

Mobileye端到端自动驾驶解决方案的深度解析

自动驾驶技术正处于快速发展之中，各大科技公司和汽车制造商均在争相布局，试图在这个新兴领域占据一席之地。Mobileye作为全球自动驾驶技术的领军企业之一，凭借其独特的端到

发表于 10-17 09:35 •420次阅读

实现自动驾驶，唯有端到端？

，去年行业主流方案还是轻高精地图城区智驾，今年大家的目标都瞄到了端到端（End-to-End, E2E）。端到

发表于 08-12 09:14 •812次阅读

理想汽车加速自动驾驶布局，成立“端到端”实体组织

近期，理想汽车在其智能驾驶领域迈出了重要一步，正式成立了专注于“端到端自动驾驶”的实体组织，该组织规模超过200人，标志着理想在

发表于 07-17 15:42 •1377次阅读

广汽丰田携手Momenta推出端到端全场景智能驾驶方案

在近日举行的广汽丰田科技开放日上，一场引领未来的智能驾驶技术盛宴吸引了全球目光。广汽丰田携手国内领先的自动驾驶解决方案提供商Momenta，共同推出了

发表于 06-29 17:36 •1703次阅读

佐思汽研发布《2024年北京车展新四化趋势分析报告》

佐思汽研发布《2024年北京车展新四化趋势分析报告》

发表于 05-21 15:16 •1341次阅读

亿咖通自研智驾芯片，L2.5装车量同比增175%

佐思汽研发布《中国汽车智驾技术与数据趋势月度监测报告（2024

发表于 04-22 15:22 •1126次阅读

智行者联合清华完成国内首套全栈式端到端自动驾驶系统的开放道路测试

近日，智行者与清华大学车辆学院李克强院士、李升波教授领导的研究团队，完成了国内首套全栈式端到端自动驾驶系统的开放道路测试。

发表于 04-22 09:24 •819次阅读

混合动力汽车研究：电动化计划推迟 PHEV&增程式占比将抬升至40%

佐思汽研发布《2023-2024年全球和中国混合动力汽车研究

发表于 01-25 13:54 •2001次阅读