0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

清华&港大提出LanguageMPC:将大语言模型和MPC相结合的新型类人智驾系统

CVer 来源:CVer公众号 2023-10-10 15:57 次阅读

e7083db2-6741-11ee-939d-92fbcf53809c.png

面对复杂多变的交通场景,基于学习的方法已成为了实现高级别自动驾驶系统的主流方案。然而,基于学习的自动驾驶系统仍面临以下挑战:

对复杂的规则和奖励函数设计的需求使其在理解交通法规等高级信息上存在困难。

受限于数据量和采样效率,处理罕见事件是其面临的一大挑战。

由于神经网络的黑盒特性,现有基于学习的自动驾驶系统缺乏良好的可解释性。

针对以上问题,我们提出将大语言模型(LLM)作为自动驾驶系统的决策核心,利用LLM像人一样思考的能力,将人类常识和推理能力作为自动驾驶系统决策的指导。同时,我们开发了将LLM给出的高层决策转化为具体驾驶行为的方法,将高层决策与底层控制器无缝结合。

e71032b0-6741-11ee-939d-92fbcf53809c.png

在CVer微信公众号后台回复:MPC,可以下载本论文pdf,学起来!

LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving 论文:https://arxiv.org/abs/2310.03026 项目网站:https://sites.google.com/view/llm-mpc LanguageMPC:将大语言模型与模型预测控制无缝结合

e716c01c-6741-11ee-939d-92fbcf53809c.png

LanguageMPC首次将LLM应用于驾驶场景,并设计了将文字形式高层决策转化为可操作驾驶行为的方法。我们定量的证明了LanguageMPC在路口和环岛等复杂交通场景中均优于现有基于学习和基于优化的自动驾驶系统。同时,我们还展示了LanguageMPC在应对多车协同控制、文字辅助驾驶等复杂任务时的强大性能。

LanguageMPC的技术核心在于以下两点:

专用于驾驶场景的思维链框架。我们使用Langchain管理LLM,通过设计初始prompt和多种工具,指导LLM依次完成对周车的意图判断和注意力分配、判断自车所处情景、给出驾驶动作指引等任务。我们将整个驾驶任务划分为多个子任务,并重新设计了场景信息组织方式,通过确保信息的简洁性来提升LLM的推理能力。

高层决策与模型预测控制衔接。我们设计了将文字形式的高层决策转化为可操作的驾驶行为的方法。具体而言,我们根据LLM的选择来重计算观测矩阵,调整MPC的注意力分配;调整惩罚函数的参数矩阵,使用LLM给出的情景判断指导MPC;将LLM的驾驶运动指引转化为运动偏置,直接调整MPC的驾驶行为。

实验结果

定量实验

e71d9770-6741-11ee-939d-92fbcf53809c.png

我们的方法在几乎所有指标上都有明显提升,并且显著降低了碰撞几率和总体Cost。

路口无保护左转

在路口左转时,LanguageMPC能根据交通规则让行对向直行车辆。

路口直行和变道超车

路口直行时,LanguageMPC能遵守路口内不超车的规则,并在到达车道内后迅速超车。

多车联合控制:窄路会车

e7323932-6741-11ee-939d-92fbcf53809c.png

LanguageMPC通过信息汇总和分别控制,实现了高效的多车联合控制,完成窄路会车。

调控驾驶风格

e745bb9c-6741-11ee-939d-92fbcf53809c.png

LanguageMPC能根据文字指引,简单直接的调控驾驶风格。

文字指导驾驶

e753bfb2-6741-11ee-939d-92fbcf53809c.png

LanguageMPC在文字指引下避开了维修路段。

LanguageMPC在关键指标上大大优于现有方法,并能处理复杂的真实世界驾驶场景,可在各种驾驶场景中实现与人类类似的性能,其推理能力和可解释性有助于克服当前基于学习的驾驶辅助系统在适应性和透明度方面的局限性。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • MPC
    MPC
    +关注

    关注

    2

    文章

    36

    浏览量

    21187
  • 语言模型
    +关注

    关注

    0

    文章

    496

    浏览量

    10234
  • 自动驾驶
    +关注

    关注

    782

    文章

    13596

    浏览量

    165850

原文标题:清华&港大提出LanguageMPC:将大语言模型和MPC相结合的新型类人智驾系统

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【大语言模型:原理与工程实践】大语言模型的应用

    ,它通过抽象思考和逻辑推理,协助我们应对复杂的决策。 相应地,我们设计了两任务来检验大语言模型的能力。一是感性的、无需理性能力的任务,类似于人类的
    发表于 05-07 17:21

    Simulink模型与Lego机器结合使用

    Simulink模型与Lego机器结合使用可提供令人愉悦的基于模型的设计体验支持LEGO MINDSTORMS NXT作为产品标准功能。
    发表于 12-20 07:15

    nesC编程语言在无线网络传感器设计中的应用

    新型编程语言——nesC其最大的特点是,组件化/模块化思想和基于事件驱动的执行模型相结合。现TinyOS操作
    发表于 07-02 12:00 2143次阅读
    nesC编程<b class='flag-5'>语言</b>在无线网络传感器设计中的应用

    动静态相结合LED显示【C语言版】

    动静态相结合LED显示【C语言版】动静态相结合LED显示【C语言版】动静态相结合LED显示【C语言
    发表于 12-29 15:51 0次下载

    知识图谱与训练模型相结合和命名实体识别的研究工作

    本次分享ICLR2021中的三篇投递文章,涉及知识图谱与训练模型相结合和命名实体识别(NER)的研究工作。 文章概览 知识图谱和语言理解的联合预训练(JAKET: Joint
    的头像 发表于 03-29 17:06 4229次阅读
    知识图谱与训练<b class='flag-5'>模型</b><b class='flag-5'>相结合</b>和命名实体识别的研究工作

    AMP01 SPICE宏模型

    AMP01 SPICE宏模型
    发表于 04-14 08:52 0次下载
    <b class='flag-5'>AMP</b>01 SPICE宏<b class='flag-5'>模型</b>

    AMP02 SPICE宏模型

    AMP02 SPICE宏模型
    发表于 04-14 08:55 0次下载
    <b class='flag-5'>AMP</b>02 SPICE宏<b class='flag-5'>模型</b>

    基于场景聚和遗传算法相结合模型求解算法

    针对新能源消纳中储能电源配置问题,基于随机规划理谂,建立了考虑霱求场景不确定性的储能电源配置期望值模型提出基于场景聚和遗传算法相结合模型
    发表于 04-16 11:34 2次下载
    基于场景聚<b class='flag-5'>类</b>和遗传算法<b class='flag-5'>相结合</b>的<b class='flag-5'>模型</b>求解算法

    知识图谱与BERT相结合助力语言模型

    感谢清华大学自然语言处理实验室对预训练语言模型架构的梳理,我们沿此脉络前行,探索预训练语言
    的头像 发表于 05-19 15:47 3658次阅读
    知识图谱与BERT<b class='flag-5'>相结合</b>助力<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    AMP01 SPICE宏模型

    AMP01 SPICE宏模型
    发表于 06-17 15:53 0次下载
    <b class='flag-5'>AMP</b>01 SPICE宏<b class='flag-5'>模型</b>

    AMP02 SPICE宏模型

    AMP02 SPICE宏模型
    发表于 06-17 15:55 2次下载
    <b class='flag-5'>AMP</b>02 SPICE宏<b class='flag-5'>模型</b>

    存储&amp;作用域&amp;生命周期&amp;链接属性

    、链接属性前言本篇文章将会为大家介绍一些变量相关的存储属性、作用域、生命周期以及链接属性的一些知识,有助于大家更好地理解程序,分析程序。一、存储&amp;amp;作用域&amp;
    发表于 12-09 15:51 5次下载
    存储<b class='flag-5'>类</b>&<b class='flag-5'>amp</b>;作用域&<b class='flag-5'>amp</b>;生命周期&<b class='flag-5'>amp</b>;链接属性

    大&amp;amp;腾讯提出DiffusionDet:第一个用于目标检测的扩散模型

    近日,来自香港大学的罗平团队、腾讯 AI Lab 的研究者联合提出一种新框架 DiffusionDet,扩散模型应用于目标检测。据了解,还没有研究可以成功地扩散
    的头像 发表于 11-22 15:35 1821次阅读

    如何区分Java中的&amp;amp;和&amp;amp;&amp;amp;

    首先给i赋值为0,如果i大于10,并且i++等于1,则输出“错误”和i的值。否则输出“正确”和i的值。分别用&amp;和&amp;&amp;运行,观察运行结果的不同。
    的头像 发表于 02-24 10:46 1468次阅读
    如何区分Java中的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;和&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;

    IU8689带主从模式,145W单声道&amp;amp;amp;2X75W立体声D音频功放

    IU8689带主从模式,145W单声道&amp;amp;2X75W立体声D音频功放
    的头像 发表于 03-23 20:24 1314次阅读
    IU8689带主从模式,145W单声道&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;2X75W立体声D<b class='flag-5'>类</b>音频功放