0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

强化学习与智能驾驶决策规划

jf_C6sANWk1 来源:阿宝1990 2023-02-08 14:05 次阅读

本文介绍了强化学习与智能驾驶决策规划。智能驾驶中的决策规划模块负责将感知模块所得到的环境信息转化成具体的驾驶策略,从而指引车辆安全、稳定的行驶。真实的驾驶场景往往具有高度的复杂性及不确定性。如何制定一套泛化能力强的决策规划机制是智能驾驶目前面临的难点之一。强化学习是一种从经验中总结的学习方式,并从长远的角度出发,寻找解决问题的最优方案。近些年来,强化学习在人工智能领域取得了重大突破,因而成为了解决智能驾驶决策规划问题的一种新的思路。

01.强化学习的介绍

b38a4ebc-a220-11ed-bfe3-dac502259ad0.jpg

强化学习(Reinforcement Learning)近些年来是人工智能的一个前言领域,属于机器学习的一个重要分支。从定义上来讲,强化学习可以通过经验探索来学习到解决问题的最优策略,即累计回报值最大的动作选取策略。在没有任何初始经验的情况下,强化学习可以通过平衡探索未知动作的可能性,学习到解决问题的最优方法,从而达到自我学习的目的。因此,强化学习与其他机器学习算法的一个显著区别为不依赖初始人工标注数据集的大小,探索式的自我学习可大幅度的节省人力成本。近些年来,随着深度学习的迅速发展,将深度学习与强化学习相结合的深度强化学习成为人工智能研究的热门领域之一,并在游戏、控制等领域取得了令人瞩目的成就。

02.智能驾驶决策规划的任务

b39a4f2e-a220-11ed-bfe3-dac502259ad0.jpg

智能驾驶的主要目的是为人们提供安全、舒适及高效的出行体验。大多数的交通事故产生的原因来自于驾驶员人为因素,例如疲劳驾驶、情绪驾驶以及路况判断失误等。因此,合理的选择驾驶行为及路线规划是智能驾驶的一个重要环节。其中,行为决策负责在接收到全局路径后,根据从感知模块得到的环境信息(车辆速度、障碍物及道路信息等),做出具体的行为决策(如变道、跟车、减速等)。而规划的任务则是在接收到决策层的宏观动作指令之后,将其转化成一条更加具体的行驶轨迹,从而能够生成一系列控制信号(油门、方向盘转角、刹车等),实现车辆的自动行驶。如何应对不同的路况信息将做出合理的决策与规划是无人驾驶智能化的一个重要指标。

03.决策规划目前的难点

b3aff450-a220-11ed-bfe3-dac502259ad0.jpg

由于实际的交通场景千变万化,道路结构差异大(高速、十字路口、停车场等),如何去设计一套通用性强的决策规划机制是目前困扰着智能驾驶的一个主要难题。同时,其他交通参与者的行为存在不确定性,不仅需要对其行为做预测,还需要考虑本车与其他交通参与者的博弈。因此,需要对时刻变化的外部环境做出快速及准确的响应。如何应对感知模块提供的信息做不到100%的准确和100%的全覆盖也是智能车在决策规划时要考虑的重要因素。

04.强化学习对于智能驾驶决策规划的意义

b3ba2fec-a220-11ed-bfe3-dac502259ad0.jpg

强化学习适用于求解具有时序性的决策问题,这正与智能驾驶的决策过程相契合。结合神经网络的深度强化学习框架可以增加驾驶场景的泛化能力。同时,考虑部分不可观测环境的强化学习流程可以评估交通参与者的不确定性,并通过预测与推演的方式从长远的角度出发来寻求最优的驾驶方案。更重要的是,强化学习由于其自身具有应对外部环境改变而产生进化的能力。当未知的corner case产生时,智能体可以通过改变自身的驾驶策略来适应并探索学习到解决该问题的方法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46820

    浏览量

    237458
  • 智能驾驶
    +关注

    关注

    3

    文章

    2449

    浏览量

    48633
  • 强化学习
    +关注

    关注

    4

    文章

    265

    浏览量

    11208

原文标题:强化学习对于智能驾驶决策规划的意义

文章出处:【微信号:阿宝1990,微信公众号:阿宝1990】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮!

    复杂环境互动的能力及确保行为的伦理和安全性。 未来的研究需要将视觉、语音和其他传感技术与机器人技术结合,探索更加先进的知识表示和记忆模块,利用强化学习进一步优化决策过程。 具身智能的发展需要更多跨学科
    发表于 11-11 10:20

    如何使用 PyTorch 进行强化学习

    强化学习(Reinforcement Learning, RL)是一种机器学习方法,它通过与环境的交互来学习如何做出决策,以最大化累积奖励。PyTorch 是一个流行的开源机器
    的头像 发表于 11-05 17:34 215次阅读

    智能驾驶在共享出行中的作用

    智能驾驶在共享出行中发挥着至关重要的作用,它不仅改变了传统的出行方式,还提高了出行效率、安全性和用户体验。以下是对智能驾驶在共享出行中作用的介绍: 一、提高出行效率
    的头像 发表于 10-24 09:09 435次阅读

    智能驾驶的挑战与机遇

    等传感器在恶劣天气下感知能力有限,难以准确识别障碍物及道路状况。 决策算法复杂 :自动驾驶系统需在复杂交通环境中做出安全、高效且合规的决策,对算法智能性及适应性要求极高。 跨领域技术融
    的头像 发表于 10-23 16:00 603次阅读

    智能驾驶与传统驾驶的区别

    智能驾驶与传统驾驶在多个方面存在显著差异。以下是对两者区别的分析: 一、驾驶方式与操控性 智能驾驶
    的头像 发表于 10-23 15:43 404次阅读

    智能驾驶技术发展趋势

    人工智能与机器学习 : 人工智能凭借强大的理解和决策能力,已经成为支撑高级别自动驾驶落地应用的关键技术。未来,超级人工
    的头像 发表于 10-23 15:41 483次阅读

    谷歌AlphaChip强化学习工具发布,联发科天玑芯片率先采用

    近日,谷歌在芯片设计领域取得了重要突破,详细介绍了其用于芯片设计布局的强化学习方法,并将该模型命名为“AlphaChip”。据悉,AlphaChip有望显著加速芯片布局规划的设计流程,并帮助芯片在性能、功耗和面积方面实现更优表现。
    的头像 发表于 09-30 16:16 381次阅读

    人工智能驾驶技术包括哪些技术

    人工智能驾驶技术,也称为自动驾驶技术,是一种利用计算机视觉、机器学习、人工智能等多种先进技术,使汽车在无人干预的情况下自主行驶的技术。这一领
    的头像 发表于 07-23 16:31 804次阅读

    深度学习在自动驾驶中的关键技术

    随着人工智能技术的飞速发展,自动驾驶技术作为其中的重要分支,正逐渐走向成熟。在自动驾驶系统中,深度学习技术发挥着至关重要的作用。它通过模拟人脑的学习
    的头像 发表于 07-01 11:40 666次阅读

    通过强化学习策略进行特征选择

    更快更好地学习。我们的想法是找到最优数量的特征和最有意义的特征。在本文中,我们将介绍并实现一种新的通过强化学习策略的特征选择。我们先讨论强化学习,尤其是马尔可夫决策
    的头像 发表于 06-05 08:27 317次阅读
    通过<b class='flag-5'>强化学习</b>策略进行特征选择

    VADv2:基于概率性规划的端到端自动驾驶

    不同于感知,规划中存在着更多的不确定性,对于同一场景,存在不同的合理的决策规划结果。环境信息到决策规划不存在明确的映射关系,因此
    的头像 发表于 02-22 10:21 1461次阅读
    VADv2:基于概率性<b class='flag-5'>规划</b>的端到端自动<b class='flag-5'>驾驶</b>

    AI算法的本质是模拟人类智能,让机器实现智能

    电子发烧友网报道(文/李弯弯)AI算法是人工智能领域中使用的算法,用于模拟、延伸和扩展人的智能。这些算法可以通过机器学习、深度学习强化学习
    的头像 发表于 02-07 00:07 5604次阅读

    大疆车载获比亚迪与一汽集团投资,估值15亿美元,预计2024年正式上市

    大疆车载是一家专业从事智能驾驶系统及相关核心组件研发、生产与销售的企业。他们拥有深厚的感知、机器学习、定位、决策规划和控制等技术,以及成熟
    的头像 发表于 02-01 09:54 1429次阅读

    两种端到端的自动驾驶系统算法架构

    基于学习的自动驾驶是一个活跃的研究领域。采用了一些基于学习驾驶方法,例如可供性和强化学习,取得了不错的性能,模仿方法也被用来回归人类演示的
    发表于 01-18 09:33 1293次阅读
    两种端到端的自动<b class='flag-5'>驾驶</b>系统算法架构

    全局路径规划RRT算法原理

    无人驾驶路径规划 众所周知,无人驾驶大致可以分为三个方面的工作:感知,决策及控制。 路径规划是感知和控制之间的
    的头像 发表于 11-24 15:57 976次阅读