清华&港大提出LanguageMPC：将大语言模型和MPC相结合的新型类人智驾系统-电子发烧友网

面对复杂多变的交通场景，基于学习的方法已成为了实现高级别自动驾驶系统的主流方案。然而，基于学习的自动驾驶系统仍面临以下挑战：

对复杂的规则和奖励函数设计的需求使其在理解交通法规等高级信息上存在困难。

受限于数据量和采样效率，处理罕见事件是其面临的一大挑战。

由于神经网络的黑盒特性，现有基于学习的自动驾驶系统缺乏良好的可解释性。

针对以上问题，我们提出将大语言模型（LLM）作为自动驾驶系统的决策核心，利用LLM像人一样思考的能力，将人类常识和推理能力作为自动驾驶系统决策的指导。同时，我们开发了将LLM给出的高层决策转化为具体驾驶行为的方法，将高层决策与底层控制器无缝结合。

在CVer微信公众号后台回复：MPC，可以下载本论文pdf，学起来！

LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving 论文：https://arxiv.org/abs/2310.03026 项目网站：https://sites.google.com/view/llm-mpc LanguageMPC：将大语言模型与模型预测控制无缝结合

LanguageMPC首次将LLM应用于驾驶场景，并设计了将文字形式高层决策转化为可操作驾驶行为的方法。我们定量的证明了LanguageMPC在路口和环岛等复杂交通场景中均优于现有基于学习和基于优化的自动驾驶系统。同时，我们还展示了LanguageMPC在应对多车协同控制、文字辅助驾驶等复杂任务时的强大性能。

LanguageMPC的技术核心在于以下两点：

专用于驾驶场景的思维链框架。我们使用Langchain管理LLM，通过设计初始prompt和多种工具，指导LLM依次完成对周车的意图判断和注意力分配、判断自车所处情景、给出驾驶动作指引等任务。我们将整个驾驶任务划分为多个子任务，并重新设计了场景信息组织方式，通过确保信息的简洁性来提升LLM的推理能力。

高层决策与模型预测控制衔接。我们设计了将文字形式的高层决策转化为可操作的驾驶行为的方法。具体而言，我们根据LLM的选择来重计算观测矩阵，调整MPC的注意力分配；调整惩罚函数的参数矩阵，使用LLM给出的情景判断指导MPC；将LLM的驾驶运动指引转化为运动偏置，直接调整MPC的驾驶行为。

实验结果

定量实验

我们的方法在几乎所有指标上都有明显提升，并且显著降低了碰撞几率和总体Cost。

路口无保护左转

在路口左转时，LanguageMPC能根据交通规则让行对向直行车辆。

路口直行和变道超车

路口直行时，LanguageMPC能遵守路口内不超车的规则，并在到达车道内后迅速超车。

多车联合控制：窄路会车

LanguageMPC通过信息汇总和分别控制，实现了高效的多车联合控制，完成窄路会车。

调控驾驶风格

LanguageMPC能根据文字指引，简单直接的调控驾驶风格。

文字指导驾驶

LanguageMPC在文字指引下避开了维修路段。

LanguageMPC在关键指标上大大优于现有方法，并能处理复杂的真实世界驾驶场景，可在各种驾驶场景中实现与人类类似的性能，其推理能力和可解释性有助于克服当前基于学习的驾驶辅助系统在适应性和透明度方面的局限性。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

MPC

MPC

+关注

关注
2

文章
36

浏览量
21303
语言模型

语言模型

+关注

关注
0

文章
550

浏览量
10408
自动驾驶

自动驾驶

+关注

关注
787

文章
13992

浏览量
167632

原文标题：清华&港大提出LanguageMPC：将大语言模型和MPC相结合的新型类人智驾系统

文章出处：【微信号：CVer，微信公众号：CVer】欢迎添加关注！文章转载请注明出处。

【大语言模型：原理与工程实践】大语言模型的应用

，它通过抽象思考和逻辑推理，协助我们应对复杂的决策。相应地，我们设计了两类任务来检验大语言模型的能力。一类是感性的、无需理性能力的任务，类似于人类的

发表于 05-07 17:21

将Simulink模型与Lego机器人结合使用

将Simulink模型与Lego机器人结合使用可提供令人愉悦的基于模型的设计体验支持LEGO MINDSTORMS NXT作为产品标准功能。

发表于 12-20 07:15

nesC编程语言在无线网络传感器设计中的应用

新型编程语言——nesC其最大的特点是，将组件化／模块化思想和基于事件驱动的执行模型相结合。现TinyOS操作

发表于 07-02 12:00 •2210次阅读

nesC编程<b class='flag-5'>语言</b>在无线网络传感器设计中的应用

动静态相结合LED显示【Ｃ语言版】

动静态相结合LED显示【Ｃ语言版】动静态相结合LED显示【Ｃ语言版】动静态相结合LED显示【Ｃ语言

发表于 12-29 15:51 •0次下载

知识图谱与训练模型相结合和命名实体识别的研究工作

本次将分享ICLR2021中的三篇投递文章，涉及知识图谱与训练模型相结合和命名实体识别（NER）的研究工作。文章概览知识图谱和语言理解的联合预训练（JAKET： Joint

发表于 03-29 17:06 •4486次阅读

AMP01 SPICE宏模型

AMP01 SPICE宏模型

发表于 04-14 08:52 •0次下载

AMP02 SPICE宏模型

AMP02 SPICE宏模型

发表于 04-14 08:55 •0次下载

基于场景聚类和遗传算法相结合的模型求解算法

针对新能源消纳中储能电源配置问题，基于随机规划理谂，建立了考虑霱求场景不确定性的储能电源配置期望值模型，提出基于场景聚类和遗传算法相结合的模型

发表于 04-16 11:34 •2次下载

知识图谱与BERT相结合助力语言模型

感谢清华大学自然语言处理实验室对预训练语言模型架构的梳理，我们将沿此脉络前行，探索预训练语言

发表于 05-19 15:47 •3877次阅读

AMP01 SPICE宏模型

AMP01 SPICE宏模型

发表于 06-17 15:53 •0次下载

AMP02 SPICE宏模型

AMP02 SPICE宏模型

发表于 06-17 15:55 •2次下载

存储类&amp;作用域&amp;生命周期&amp;链接属性

、链接属性前言本篇文章将会为大家介绍一些变量相关的存储属性、作用域、生命周期以及链接属性的一些知识,有助于大家更好地理解程序，分析程序。一、存储类&amp;amp;作用域&amp;

发表于 12-09 15:51 •5次下载

港大&amp;amp;腾讯提出DiffusionDet：第一个用于目标检测的扩散模型

近日，来自香港大学的罗平团队、腾讯 AI Lab 的研究者联合提出一种新框架 DiffusionDet，将扩散模型应用于目标检测。据了解，还没有研究可以成功地将扩散

发表于 11-22 15:35 •2047次阅读

如何区分Java中的&amp;amp;和&amp;amp;&amp;amp;

首先给i赋值为0，如果i大于10，并且i++等于1，则输出“错误”和i的值。否则输出“正确”和i的值。分别用&amp;和&amp;&amp;运行，观察运行结果的不同。

发表于 02-24 10:46 •1679次阅读

IU8689带主从模式，145W单声道&amp;amp;amp;2X75W立体声D类音频功放

IU8689带主从模式，145W单声道&amp;amp;2X75W立体声D类音频功放

发表于 03-23 20:24 •1620次阅读