0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于Apollo分布式可扩展平台的自动驾驶设计

YB7m_Apollo_Dev 来源:互联网 作者:佚名 2018-04-26 08:52 次阅读
长沙智能驾驶研究院产品研发总监 黄英君

Apollo集中运行感知、决策、控制模块,对资源、实时性、可靠性需求是不同的,对计算平台、操作系统、运行环境的要求也各不相同。黄英君将这些模块进行解耦,分布式集成运行在不同的计算平台和操作系统上,即在一个高可靠的双机备份低成本平台上运行决策与控制模块,在多个低成本高性能技术平台上运行感知模块,实现一个分布式可扩展的解决方案。

以前要搭建Apollo开发平台的初期投入不菲,至少需要几万元。根据他提供的低成本方案,只需5000元左右(最新的价格是教育机构299美元),就能搭建起Apollo的开发平台,大大降低了自动驾驶开发的门槛。(提示:目前还只是能够部署,让Apollo的所有模块跑起来,还无法做到很流畅的实时的跑,这里有待大家一起去努力完善)。

以下是分享的全部内容。

作为一名普通的开发者,我在接触Apollo几个月的时间里,一直把Apollo作为学习的平台和工具。

首先Apollo代码更新很快,但是最近一次大规模的更新是在3月25日左右,后面几天发现有十几个到二十几个文件在更新---建议大家每天早上上班之后先查看GitHub一下。

第一个值得关注的文件是perception_lowcost.sh,这个名字非常有意思,脚本内容如下:

1
run perception "$@"--flagfile=modules/perception/conf/perception_lowcost.conf

这个加载了一个配置文件,打开后发现:

1234567
#Camera node subnodes {   id: 3   name: "CameraProcessSubnode"   reserve: "device_id:camera;"   type: SUBNODE_IN }

上面这个subnode是新增加的摄像机节点;原来的配置文件中的两个信号灯摄像机节点、激光雷达节点都没有出现:

12345678910111213141516171819
 #TrafficLight Preprocess node.subnodes {  id: 41  name: "TLPreprocessorSubnode"  type: SUBNODE_IN } #TrafficLight process node.subnodes {  id: 42  name: "TLProcSubnode"  type: SUBNODE_OUT } #64-Lidar Input nodes.subnodes {  id: 1  name: "LidarProcessSubnode"  reserve: "device_id:velodyne64;"  type: SUBNODE_IN }

关于这几个摄像机,我们可以在驱动目录里面查看更详细的信息

2.0版本有两个摄像机。打开目录:pollomodulesdriversusb_camlaunch的start_leopard.launch文件,定义了三个摄像机。

123
"traffic_short_topic_name"fault="/apollo/sensor/camera/traffic/image_short" />"traffic_long_topic_name" default="/apollo/sensor/camera/traffic/image_long"/>"perception_obstacle"default="/apollo/perception/obstacle/camera" />

前两个是用来针对交通信号灯的,第三个针对障碍物,推测这个摄像机就是用来检测障碍物的。

打开源码perception目录,有一个camera目录,这个目录变化最大,也是开放代码量最多的一个目录,增加了车道线功能。我们是不是就可以得出结论,第三个摄像机将是执行障碍物检测和车道线检测。

综上所述,最新版本的Apollo,特别强调低成本,具体的方式是在高速场景下弱化了弱化了激光雷达和两个信号灯检测摄像机,增加了一个摄像机,专门执行障碍物检测和车道线检测。这个变化跨度非常大,一个激光雷达的价格就是70多万(64线),可以说是非常大的一个跨越。

另外说一句题外话,Apollo这个代码写的特别好,写代码的是很资深的架构师,所以Apollo这套代码有非常浓重的谷歌风格,并使用了大量的谷歌系工具,看它的架构非常舒服的,可以作为一个经典的大型c++工程demo,来学习他的c++编程和大型项目的构建。为什么考虑对Apollo进行分布式扩展?

为什么考虑对Apollo进行分布式扩展?

为什么考虑对Apollo进行分布式扩展?因为去年9月份我安排一个实习生,他开始做了几天,就说目录挺多,但是总装不上。后来我发现坑越来越多,问题越来越多。

去年9月份我们订购了PX2,但却缺货。后来代理商把他们自己的一块给我们用了,左边是Apollo推荐的计算平台,是***一家公司的,这个工控机非常小巧和紧凑,它的散热做得非常好,但是价格还是有点贵,而且订货周期比较长,还有就是PX2价格是十万。

上图是TX2,256个GPU核,一般性能好的计算机的开发环境对程序员非常友好,东西全,资料非常多,很快上手。最重要的是TX2非常便宜,教育用户版不到三百美元,可以用它做台式机做不了的事情,供应充足,我们公司用TX2做了非常漂亮紧凑的车载盒子。

其他还有一些性能、定位差不多的芯片,比如NXP,它在车企用的非常多,可靠性、安全性都很好。现在新推出的i.MX8性能稳定,是六核的架构,带GPU,但也有供货问题。它在车载和智能仪表领域的占有率非常高。

另一个是Renesas,一家汽车电子老牌厂家,在自动驾驶计算平台占有一席之地。

为什么我要把它做成分布式的?分布式部署真正是由功能和性能决定的。我们把自动驾驶模块划分一下,有两种分法。一种是Apollo分法,分成四个模块:感知、规划、决策和控制,另一种从性能区分,Sensor、Planning和Action。

现在智能驾驶计算平台的现状如何呢?目前没有一个芯片、计算平台、操作系统能够同时满足上述4个指标。

我们让控制模块跑在可靠的、安全的芯片上,但是满足了安全条件,计算力就跟不上了。感知模块要求强大的计算力,但是这种情况下再做安全,可能成本无法承受。所以最好的办法就是让合适的芯片运行合适的模块,让合适的操作系统来承载合适的模块。

我们把Apollo的四个模块拆分开,感知模块可以跑在高性能的感知平台上,控制模块可以跑在高可靠性的操作系统上。

我们提出一个构想,把控制模块跑在高可靠性的芯片上,感知模块用低成本的处理器。即使一台车要接十二个摄像机,一块芯片不能用了,感知部分摄像机宕掉,问题也不大,车还在控制中。但是控制模块出现问题就不行了。

我们增加了TX2对Docker的支持,使用JetPack3.1刷机。内核缺少containers运行所需的支持,这是我们定制刷新内核的文件,这些都是在网上公开的。编译之后更新,然后重启,重启以后只要带container就说明这个内核已经可以安装到Apollo上了。

增加TX2对Docker的支持

Docker onTegra本身有下面的问题:

•TX-2 or other Tegra devices 不支持nvidia-docker

• 使用JetPack3.1刷机,内核缺少containers 运行所需的支持

•JetPack3.2解决了这个问题(我还没验证)

•nvidia-docker wrapper在TX2上不能正常运行,无法获取GPU设备

解决方法是:

•定制内核,增加对containers 的支持

•传递所需的参数给Docker,使之能够获取GPU设备

通过如上面几幅图中所述,增加TX2对docker的支持、定制内核配置文件、编译内核、修改Apollo docker脚本后,Apollo docker中可以运行cuda程序了。

编译Apollo

接下来编译Apollo:

• 构建缺少的依赖库:caffe(GPU版),vtk,需要自己写build文件,修改workspace配置文件;

• 重新编译arm版本的依赖库:QPSASES,IPopt,libfastcdr,libfastrtps;

• 重新编译版本不一致的依赖库:glog,gflags,protobuf;

• 修改Apollo中某些不兼容的代码;

感知模块Trafficlight中,caffe只提供了X86平台动态库,X86架构下SSE系列,arm平台无法使用,要么改写,要么直接跳过。

在Apollo中构建tensorRT 开发环境

在Apollo中构建tensorRT,存在以下问题:

• docker内缺少一系列的库;

• 缺少tx2相机驱动;

• 需要使用tegra定制的libGL.so;

• libgbm版本不匹配;

• 摄像机守护进程在主机端,docker内无法驱动;

解决办法如下:

1、用挂载或者copy的形式准备好所需的动态库,接近100多个;

12345678
cp host /var/nvidia/nvcam/settings -> dockercp host /var/nvidia/nvcam/input -> docker-v/usr/lib/aarch64-linux-gnu:/usr/lib/aarch64-linux-gnu:ro -v/usr/lib/aarch64-linux-gnu/gstreamer-1.0:/usr/lib/aarch64-linux-gnu/gstreamer-1.0:ro -v/usr/lib/aarch64-linux-gnu/tegra-egl:/usr/lib/aarch64-linux-gnu/tegra-egl:ro  -v/usr/lib/aarch64-linux-gnu/mesa-egl:/usr/lib/aarch64-linux-gnu/mesa-egl:ro   -v/run:/run:rw   -v/lib/firmware/tegra18x:/lib/firmware/tegra18x:ro    

2、使用libdrm-2.4.80以上版本重新编译;

3、为tegra版本libGL.so建立软连接;

4、修改主机配置,让摄像机守护进程在docker内启动;

构建tensorRT完成后,就可以在Apollo Docker中运行tensorRT,实现12-14帧的多目标检测。

目前成果和后续工作

为大家说一下我们的阶段性成果,目前已发布部分资源供测试:

•Apollo docker on TX-2的完整镜像;

•使用不同操作系统重刷Jetpack时会遇到编译错,这里提供完整的内核源码,无需自行下载并执行xconfig;

• 一些需要在arm下单独编译的库;

•修改的Apollo的docker脚本文件;

• 基于Bazel构建的cuda应用程序开发模板

后续我们将做的工作有:

  • 解决ROS跨版本通信问题

  • 全面使用Nvidia Visionworks对图像操作进行改写

  • 使用TensorRT对深度学习相关的功能模块进行inference优化

  • 对其他车载计算平台的测试和验证

  • 针对QNX的移植适配工作

  • 车载嵌入式设备的封装

到2018年5月份,我们会提出专门针对ADAS的QNX开发包。如果说可以解决ROS跨版本通信的问题,那么我们把Apollo往QNX发展是可行的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 汽车电子
    +关注

    关注

    3027

    文章

    7984

    浏览量

    167271
  • 自动驾驶
    +关注

    关注

    784

    文章

    13870

    浏览量

    166609
  • Apollo
    +关注

    关注

    5

    文章

    342

    浏览量

    18474

原文标题:自动驾驶公开课 | Apollo的分布式可扩展计算平台探索

文章出处:【微信号:Apollo_Developers,微信公众号:Apollo开发者社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    百度Apollo开放平台10.0正式发布

    12月4日,百度正式发布Apollo开放平台的全新升级版本——Apollo开放平台10.0,基于自动驾驶大模型ADFM设计重构算法,助力全球
    的头像 发表于 12-04 16:20 390次阅读

    深入解析自动驾驶系统中的DCU、MCU、MPU、SoC及整车电子架构

    摘要本文探讨了自动驾驶中的DCU、MCU和MPU在电子电气架构中的作用,比较了分布式与集中式架构的优势,以及ADAS系统从L0-L2+的发展历程。着重分析了MCU和MPU的区别,以及它们在汽车智能化
    的头像 发表于 11-20 17:08 1304次阅读
    深入解析<b class='flag-5'>自动驾驶</b>系统中的DCU、MCU、MPU、SoC及整车电子架构

    Apollo自动驾驶开放平台10.0版即将全球发布

    百度在自动驾驶领域的创新步伐再次加快,今年5月,公司率先推出了全球首个支持L4级自动驾驶应用的自动驾驶大模型——Apollo ADFM。这一突破性技术的问世,不仅标志着百度在
    的头像 发表于 11-07 11:24 849次阅读

    自动驾驶竞赛升温:全球头部企业争相出牌

    Apollo自动驾驶开放平台10.0,该平台将搭载全新的自动驾驶大模型ADFM,进一步推动自动驾驶
    的头像 发表于 10-11 15:28 835次阅读

    分布式工业物联网平台:引领智能制造的新篇章

    随着全球化和信息化进程的加速,分布式工业物联网平台作为智能制造的重要基石,正逐步展现出其强大的潜力和广泛的应用前景。这一平台通过整合不同地区的人力物力资源,实现产品生产的最低消耗,并借助物联网技术将
    的头像 发表于 09-27 17:09 251次阅读

    FPGA在自动驾驶领域有哪些优势?

    需更换整个硬件平台。 综上所述,FPGA在自动驾驶领域具有高性能、灵活性、低延迟、高能效比、硬件级安全、易于集成与扩展以及长期可维护性等显著优势。这些优势使得FPGA成为自动驾驶技术
    发表于 07-29 17:11

    FPGA在自动驾驶领域有哪些应用?

    是FPGA在自动驾驶领域的主要应用: 一、感知算法加速 图像处理:自动驾驶中需要通过摄像头获取并识别道路信息和行驶环境,这涉及到大量的图像处理任务。FPGA在处理图像上的运算速度快,并行性强,且功耗
    发表于 07-29 17:09

    百度发布全球首个L4级自动驾驶大模型

    近日,百度Apollo宣布了全球首个支持L4级自动驾驶的大模型Apollo ADFM(Autonomous Driving Foundation Model)。这一突破性的技术成果,标志着自动
    的头像 发表于 05-17 09:58 494次阅读

    百度发布全球首个L4级自动驾驶大模型Apollo ADFM

    5月15日,百度Apollo在武汉举行的Apollo Day 2024中推出了全球首款L4级自动驾驶大模型Apollo ADFM(Autonomous Driving Foundati
    的头像 发表于 05-15 16:21 1193次阅读

    Momenta联合高通基于最新一代Snapdragon Ride平台发布面向先进驾驶辅助和自动驾驶功能的全新智能驾驶解决方案

    4月22日,领先的自动驾驶技术公司Momenta联合全球汽车技术创新企业高通技术公司宣布,双方面向先进驾驶辅助系统(ADAS)和自动驾驶(AD)功能推出多款
    发表于 04-25 08:11 784次阅读
    Momenta联合高通基于最新一代Snapdragon Ride<b class='flag-5'>平台</b>发布面向先进<b class='flag-5'>驾驶</b>辅助和<b class='flag-5'>自动驾驶</b>功能的全新智能<b class='flag-5'>驾驶</b>解决方案

    未来已来,多传感器融合感知是自动驾驶破局的关键

    的架构,预计未来许多智能驾驶团队都会引入“占用网络”来提升系统能力。多维像素的应用前景非常广阔。昱感微的融合感知技术+BEV +Transformer+占用网格有望成为L3/L4级自动驾驶最优的落地方案。 昱感微电子融合感知平台
    发表于 04-11 10:26

    鸿蒙OS 分布式任务调度

    鸿蒙OS 分布式任务调度概述 在 HarmonyO S中,分布式任务调度平台对搭载 HarmonyOS 的多设备构筑的“超级虚拟终端”提供统一的组件管理能力,为应用定义统一的能力基线、接口
    的头像 发表于 01-29 16:50 514次阅读

    分布式大屏控制系统的扩展性设计

    分布式大屏控制系统的扩展性设计是确保系统能够适应不断增长的需求和未来发展的关键因素。以下是扩展性设计的几个方面: 模块化设计:将系统划分
    的头像 发表于 01-29 14:46 612次阅读

    什么是分布式架构?

    分布式架构是指将一个系统或应用拆分成多个独立的节点,这些节点通过网络连接进行通信和协作,以实现共同完成任务的一种架构模式。这种架构模式旨在提高系统的扩展性、可靠性和性能表现。 一、分布式
    的头像 发表于 01-12 15:04 1278次阅读
    什么是<b class='flag-5'>分布式</b>架构?

    分布式节点服务器是什么?

    部署在不同的服务器上进行处理和存储,以实现负载均衡和容错处理。这种架构模式旨在提高系统的扩展性、可靠性和性能表现,以满足大规模数据处理、复杂任务处理等需求。 分布式节点服务器的实现方式有多种,其中最常用的
    的头像 发表于 01-12 15:04 754次阅读
    <b class='flag-5'>分布式</b>节点服务器是什么?