0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

BEV、单目和激光雷达 3D 感知算法开箱即用,无缝衔接 Apollo!

NVIDIA英伟达 来源:未知 2023-03-10 23:00 次阅读

当今时代,通过科技改变生产生活方式的各种先进技术纷纷崛起,交通产业也经历着巨大的变革。国家对于智能交通和交通强国战略的支持使得交通产业更加需要相关技术支撑与赋能。对此,百度飞桨团队与 Apollo 自动驾驶团队强强联合,聚焦人工智能关键技术,深耕自动驾驶各个场景,汇聚各方力量,不断拓宽开源之路。

此次,飞桨基于和 Apollo 自动驾驶团队合作开发的大量业务实践经验,结合自动驾驶感知算法开发难点,联合 NVIDIA 在 NGC 飞桨容器中进行深度适配,正式发布飞桨首个端到端 3D 感知开发套件 Paddle3D,欢迎大家在 NVIDIA GPU 上体验!

加入 Paddle3D 技术交流

体验 NVIDIA NGC + Paddle3D

Paddle3D 官方开源代码链接如下,也欢迎大家入群进行 3D 感知开发的技术交流,接下来将为大家全面介绍 Paddle3D。

https://github.com/PaddlePaddle/Paddle3D

1584f1a8-bf54-11ed-bfe3-dac502259ad0.jpg    

Paddle3D 概览

Paddle3D 是百度飞桨官方开源的端到端 3D 感知开发套件,套件整体结构自下而上分为框架层、基础层、算法层、工具层 4 层。接下来具体介绍 Paddle3D 的整体架构。

15a85eea-bf54-11ed-bfe3-dac502259ad0.png

2.1 基础层

基础层主要提供了数据处理管道、数据集的基础支持、自定义算子的开发支持、高级 API 支持。

2.1.1 数据处理管道

提供数据处理的 I/O 加速能力,提高训练阶段数据吞吐速度。同时提供多种数据变换、数据增强能力,满足 3D 模型的快速开发。

2.1.2 数据集

在本次的正式版中,我们全面支持了自动驾驶三大开源数据集 KITTI、Waymo 和 nuScenes。同时,Paddle3D 还支持用户自定义数据集进行训练,详情请前往 Paddle3D 官方开源仓库。

2.1.3 真值库

在模型精度优化方面,除了模型层面的一些优化策略,Paddle3D 在数据层面也提供了基于真值库的在线优化策略。在做自动驾驶感知任务时,采集和标注点云数据所耗费的人力成本偏高,我们希望可以充分利用已有的数据来拓展训练数据的多样性。基于真值库的在线优化策略是先根据已有的训练数据离线地生成真值库,训练的过程中在线地从真值库里面随机采样一些真值目标,放到当前帧中来合成一帧新的点云,从而提升模型的泛化能力。

下图是使用这个优化策略前后的精度对比情况,整体精度有 5.39%的提升。

15f3aa3a-bf54-11ed-bfe3-dac502259ad0.png1613d238-bf54-11ed-bfe3-dac502259ad0.png

2.1.4 自定义算子即训即推

3D 感知模型在训练过程中会遇到需要开发特色的自定义算子的情况,例如用于过滤重叠三维框的非极大值抑制操作(3D IoU NMS)、PointNet++中聚合和采样点云的操作、点云体素化操作等等。Paddle3D 的模型均可基于飞桨的原生推理库 Paddle Inference 完成服务器端和云端的模型部署,且不需要在部署阶段重新开发自定义算子,完全做到即训即用。

2.2 算法层

算法层主要提供了开箱即用的单目 3D 感知、点云 3D 感知、BEV 3D 感知、多模态 3D 感知等算法,同时提供了主流的骨干网络实现参考。

2.2.1 单目 3D 感知模型

在和自动驾驶开源框架 Apollo 的合作过程中,我们沉淀了 SMOKE、CaDDN 这两个经典的单目 3D 感知模型,并且已经作为 Apollo 最新的内置 3D 视觉感知模型。此外,在本次正式版发布中,我们还新增了 DD3D 模型,FCOS3D 模型的支持也即将完成。

2.2.2 激光雷达 3D 感知模型

除了视觉模型之外,我们在和 Apollo 的合作过程中同样沉淀了激光雷达 3D 感知模型 PointPillars、CenterPoint,且已作为 Apollo 的原生激光雷达支持模型,本次正式版中我们还新增了 IA-SSD、PAConv、PV-RCNN、Voxel-RCNN 等前沿点云 3D 检测模型,同时,也补充了点云分割模型 SqueezeSegV3。

2.2.3 BEV 模型

在自动驾驶任务中,对周围场景的视觉感知非常重要,这一工作可以通过多个摄像头给出的二维图像完成对 3D 检测框或语义图的检测。当前,最直接的解决方案是使用单目相机框架和跨相机后处理,该框架的缺点是其需要单独处理不同的视图,无法跨相机捕获信息,导致性能和效率低下。作为单目相机框架的替代方案,一种更统一的框架是从多目相机图像中提取整体表示。鸟瞰图 (Bird’s Eye-View,BEV) 是一种常用的周围场景表示方法,它能清晰地呈现物体的位置和规模,适用于各种自动驾驶任务。

而最近以 BEV 为基础的 3D 检测方案席卷自动驾驶届,我们也在持续跟进该方向。目前已在 Paddle3D 的模型库中补充BEV经典模型 PETR、PETRv2、BEVFormer,而 BEVFusion 正在实现中,即将和大家见面。

2.3. 工具层

工具层主要提供了基于 VisualDL 的训练、推理效果可视化,同时提供了模型的量化部署加速能力、Apollo 的集成开发能力以及混合精度训练能力。

2.3.1 自动混合精度训练支持

自动混合精度训练(Auto Mixed Precision, AMP)是指通过混合使用单精度和半精度数据格式,加速深度神经网络训练的过程,同时保持了单精度训练所能达到的网络精度。混合精度训练能够加速计算过程,同时减少内存使用和存取,并使得在特定的硬件上可以训练更大的模型或 batch size。

Paddle3D 目前全面支持混合精度训练,从而进一步优化 3D 感知算法开发对硬件的需求,加速训练。

2.3.2 量化部署支持

模型量化是一种将浮点计算转成低比特定点计算的技术,可以有效地降低模型参数大小,降低算力、内存等资源消耗,从而提升模型在端侧硬件上的运行效果。

3D 感知模型相比传统的 2D 检测模型往往模型更复杂,参数更多,在服务器上可能可以达到不错的推理速度和精度的平衡,但是实际部署时,由于硬件算力限制,帧率往往达不到要求。对此,Paddle3D 对 3D 感知模型通过量化压缩等手段在端侧硬件达到了实时性能。目前官方支持 SMOKE、CenterPoint 的量化部署,同时 Paddle3D 将结合飞桨部署神器 FastDeploy 对 3D 感知模型通过量化压缩等手段在端侧硬件进行端到端的优化,支持更多模型的量化部署,链接参考如下:

https://github.com/PaddlePaddle/Paddle3D/tree/develop/configs/quant

https://github.com/PaddlePaddle/FastDeploy

2.3.3 稀疏卷积支持

在基于点云的 3D 检测任务中,主流的解决思路会把无序的点云表示成有序的三维体素空间,精准地学习到几何结构特征的最佳方法莫过于采取 3D 卷积。但是 3D 卷积耗费非常大的显存和计算量,使得面向实时端侧场景的应用须以损失部分检测精度作为代价,将三维空间压缩至二维空间后采用 2D 卷积来换取速度的提升和计算量的减小。然而,室外场景中数量高达~100k的点云经过体素化后,三维体素空间的稀疏性低至~0.5%,采用 3D 卷积会有大量零元素的计算浪费。

在稀疏 3D 卷积中,会预先建立一个规则表,表中仅记录与卷积核相乘的非零输入元素及其输出元素在密集特征层上的位置,基于规则表完成卷积计算可避免零元素的无效运算。飞桨框架 v2.4 已经全面支持稀疏计算,Paddle3D 也集成了许多使用稀疏 3D 卷积的前沿模型,如 PV-RCNN、VoxelRCNN、CenterPoint。以CenterPoint 为例,基于飞桨原生推理库 Paddle Inference 在一块 RTX 3080 显卡上的推理速度可达到 21.20 毫秒每帧,nuScenes 验证集上精度 NDS(NuScenes Detection Score)可达到 66.74%。

3645b008-bf54-11ed-bfe3-dac502259ad0.png

2.4. 用户体验持续优化

2.4.1 3D 感知算法多卡算力在线开发

考虑到 3D 感知算法在实际开发过程中对显存等硬件资源需求较大,飞桨团队提供了免费的算力资源,方便大家在线开发,同时 Paddle3D 也提供了官方的在线开发示例,欢迎大家 fork 进行二次开发。

在线开发示例链接如下:

https://aistudio.baidu.com/aistudio/projectdetail/5268894

https://aistudio.baidu.com/aistudio/projectdetail/5269115

2.4.2 详细文档

文档是快速上手一个开源项目的关键,Paddle3D 针对模型训练部署以及每个算法都有详细的文档说明,欢迎大家阅读浏览,同时我们也欢迎大家一同建立更完善的 Paddle3D 文档和教程

2.4.3 直播课&技术解读文章

考虑到 3D 感知的更新迭代速度快,上手难度大,Paddle3D 会定期组织直播课程,由开发同学为大家深入讲解 3D 感知算法的开发、部署细节。同时也会定期发布技术专栏文章进行解读。相应的课程链接以及技术文章链接我们会定期更新到 GitHub 首页,再次欢迎大家关注 Paddle3D 官方仓库:

https://github.com/PaddlePaddle/Paddle3D

2.5 Paddle3D & Apollo 无缝衔接

Apollo 是由百度开源的开放、完整、安全的自动驾驶平台,助力开发者快速搭建自动驾驶系统,Apollo 官方仓库:

https://github.com/ApolloAuto/apollo

Paddle3D 和 Apollo 在持续性的进行合作开发,目前已打通视觉感知模型 SMOKE、CaDDN,点云感知模型 PointPillars、CenterPoint,BEV 感知模型 PETR 等模型的训练和推理。用户可以在 Paddle3D 进行模型的训练、测试、导出,然后一键部署集成到 Apollo 的感知算法部分,和下游的跟踪算法、多传感器融合算法、预测算法、规划控制算法全栈运行。同时,用户可以通过 Apollo 的 DreamView 平台联合定位、预测、规划控制模块进行仿真调试,找出 Badcase 指导模型的优化开发。

详细开发步骤请参考:

https://apollo.baidu.com/community/Apollo-Homepage-Document/Apollo_Doc_CN_8_0/lidar

https://apollo.baidu.com/community/Apollo-Homepage-Document/Apollo_Doc_CN_8_0/camera

36c229bc-bf54-11ed-bfe3-dac502259ad0.png36da4ba0-bf54-11ed-bfe3-dac502259ad0.gif376d5314-bf54-11ed-bfe3-dac502259ad0.gif

2.6 总结

以上就是本次正式版本的主要内容,欢迎大家 fork 体验。未来,我们将持续更新丰富模型库和预训练模型,持续优化模型在端侧的量化压缩部署,提供更详细的开发文档以及更简洁的 API,为社区带来更好用的 3D 感知开发套件。我们也欢迎社区用户参与到 Paddle3D 的建设中,不断完善 Paddle3D。

NGC 飞桨容器介绍

如果您希望体验 PaddleNLP 的新特性,欢迎使用 NGC 飞桨容器。NVIDIA 与百度飞桨联合开发了 NGC 飞桨容器,将最新版本的飞桨与最新的NVIDIA的软件栈(如CUDA)进行了无缝的集成与性能优化,最大程度的释放飞桨框架在 NVIDIA 最新硬件上的计算能力。这样,用户不仅可以快速开启 AI 应用,专注于创新和应用本身,还能够在 AI 训练和推理任务上获得飞桨+NVIDIA 带来的飞速体验。

最佳的开发环境搭建工具 - 容器技术

  1. 容器其实是一个开箱即用的服务器。极大降低了深度学习开发环境的搭建难度。例如你的开发环境中包含其他依赖进程(redis,MySQL,Ngnix,selenium-hub等等),或者你需要进行跨操作系统级别的迁移

  2. 容器镜像方便了开发者的版本化管理

  3. 容器镜像是一种易于复现的开发环境载体

  4. 容器技术支持多容器同时运行

37bcddda-bf54-11ed-bfe3-dac502259ad0.png

最好的 PaddlePaddle 容器

NGC 飞桨容器针对 NVIDIA GPU 加速进行了优化,并包含一组经过验证的库,可启用和优化 NVIDIA GPU 性能。此容器还可能包含对 PaddlePaddle 源代码的修改,以最大限度地提高性能和兼容性。此容器还包含用于加速 ETL (DALI, RAPIDS),、训练(cuDNN, NCCL)和推理(TensorRT)工作负载的软件。

PaddlePaddle 容器具有以下优点:

  1. 适配最新版本的 NVIDIA 软件栈(例如最新版本CUDA),更多功能,更高性能

  2. 更新的 Ubuntu 操作系统,更好的软件兼容性

  3. 按月更新

  4. 满足 NVIDIA NGC 开发及验证规范,质量管理

通过飞桨官网快速获取

37fbbd5c-bf54-11ed-bfe3-dac502259ad0.png

环境准备

使用 NGC 飞桨容器需要主机系统(Linux)安装以下内容:

  • Docker 引擎

  • NVIDIA GPU 驱动程序

  • NVIDIA 容器工具包

有关支持的版本,请参阅 NVIDIA 框架容器支持矩阵 和 NVIDIA 容器工具包文档。

不需要其他安装、编译或依赖管理。无需安装 NVIDIA CUDA Toolkit。

NGC 飞桨容器正式安装:

要运行容器,请按照 NVIDIA Containers For Deep Learning Frameworks User’s Guide 中 Running A Container一章中的说明发出适当的命令,并指定注册表、存储库和标签。有关使用 NGC 的更多信息,请参阅 NGC 容器用户指南。如果您有 Docker 19.03 或更高版本,启动容器的典型命令是:

dockerrun--gpusall--shm-size=1g--ulimitmemlock=-1-it--rm
nvcr.io/nvidia/paddlepaddle:22.08-py3

*详细安装介绍 《NGC 飞桨容器安装指南》

https://www.paddlepaddle.org.cn/documentation/docs/zh/install/install_NGC_PaddlePaddle_ch.html

*详细产品介绍视频

【飞桨开发者说|NGC飞桨容器全新上线 NVIDIA产品专家全面解读】

https://www.bilibili.com/video/BV16B4y1V7ue?share_source=copy_web&vd_source=266ac44430b3656de0c2f4e58b4daf82

飞桨与 NVIDIA NGC 合作介绍

NVIDIA 非常重视中国市场,特别关注中国的生态伙伴,而当前飞桨拥有超过 535 万的开发者。在过去五年里我们紧密合作,深度融合,做了大量适配工作,如下图所示。

38560fd2-bf54-11ed-bfe3-dac502259ad0.png

今年,我们将飞桨列为 NVIDIA 全球前三的深度学习框架合作伙伴。我们在中国已经设立了专门的工程团队支持,赋能飞桨生态。

为了让更多的开发者能用上基于 NVIDIA 最新的高性能硬件和软件栈。当前,我们正在进行全新一代 NVIDIA GPU H100 的适配工作,以及提高飞桨对 CUDA Operation API 的使用率,让飞桨的开发者拥有优秀的用户体验及极致性能。

以上的各种适配,仅仅是让飞桨的开发者拥有高性能的推理训练成为可能。但是,这些离行业开发者还很远,门槛还很高,难度还很大。

为此,我们将刚刚这些集成和优化工作,整合到三大产品线中。其中 NGC 飞桨容器最为闪亮。

NVIDIA NGC Container – 最佳的飞桨开发环境,集成最新的 NVIDIA 工具包(例如 CUDA)

393fd2d4-bf54-11ed-bfe3-dac502259ad0.png

点击 “阅读原文” 或扫描下方海报二维码,即可免费注册 GTC23,在 3 月 24 日 听 OpenAI 联合创始人与 NVIDIA 创始人的炉边谈话,将由 NVIDIA 专家主持,配中文讲解和实时答疑,一起看 AI 的现状和未来!

396a1526-bf54-11ed-bfe3-dac502259ad0.jpg


原文标题:BEV、单目和激光雷达 3D 感知算法开箱即用,无缝衔接 Apollo!

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3744

    浏览量

    90831

原文标题:BEV、单目和激光雷达 3D 感知算法开箱即用,无缝衔接 Apollo!

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    激光雷达在SLAM算法中的应用综述

    SLAM算法运行的重要传感器。基于激光雷达的SLAM算法,对激光雷达SLAM总体框架进行介绍,详细阐述前端里程计、后端优化、回环检测、地图构建模块的作用并总结所使用的
    的头像 发表于 11-12 10:30 265次阅读
    <b class='flag-5'>激光雷达</b>在SLAM<b class='flag-5'>算法</b>中的应用综述

    ​亮道智能完成新一轮融资,提升激光雷达关键技术

    日前,亮道智能宣布完成新一轮融资。本轮融资由招商局资本和亦庄国投联合投资。所募集资金将用于激光雷达关键技术,新型感知功能和数据工具链以及各类落地场景基于 3D 感知数智化解决方案开发,
    的头像 发表于 07-22 11:08 305次阅读

    禾赛科技独供百度Apollo新一代无人车主激光雷达

    近日,禾赛科技宣布获得百度萝卜快跑新一代无人驾驶平台主激光雷达的独家定点供应权,标志着双方在自动驾驶领域的合作迈上新台阶。据悉,今年百度将陆续投放第六代Apollo无人车颐驰06,而这款无人车上的核心感知设备——主
    的头像 发表于 07-18 11:41 1701次阅读

    晶振在激光雷达系统中的作用有哪些

    激光雷达系统需要用精确的时间测量来计算距离和生成高分辨率的3D图像。晶振在激光雷达系统中起着关键作用,主要用于提供稳定的时钟信号和高精度的时间基准。
    的头像 发表于 05-29 11:45 553次阅读

    Hokuyo Automatic发布新款3D激光雷达(LiDAR)传感器YLM-10LX

    据麦姆斯咨询报道,光学半导体技术先驱Lumotive近日携手传感器和自动化领域的全球领先企业Hokuyo Automatic发布新款3D激光雷达(LiDAR)传感器YLM-10LX。
    的头像 发表于 05-29 09:14 1181次阅读

    森思泰克全新推出96线激光雷达和192线激光雷达产品

    多传感器融合方案是智能驾驶感知技术的必然趋势。它以摄像头、毫米波雷达、超声波雷达以及激光雷达等多种传感器协同配合来感知外界信息。
    的头像 发表于 05-28 10:03 1568次阅读
    森思泰克全新推出96线<b class='flag-5'>激光雷达</b>和192线<b class='flag-5'>激光雷达</b>产品

    基于FPGA的激光雷达控制板

    控制板主要是用于控制线阵激光器,并高效地采集和处理大量的激光点云数据,具备强大的数据处理能力和高速数据传输接口,以确保系统能够准确地感知周围环境。图激光雷达控制板框图
    的头像 发表于 05-28 08:11 609次阅读
    基于FPGA的<b class='flag-5'>激光雷达</b>控制板

    机载光子激光雷达系统用于实现高分辨率3D成像

    据麦姆斯咨询报道,近日,中国科学技术大学合肥微尺度物质科学国家研究中心的研究团队开发出了一种结构紧凑、重量轻的光子机载激光雷达系统,可以用低功率激光获取高分辨率的3D图像。
    的头像 发表于 05-06 09:05 795次阅读
    机载<b class='flag-5'>单</b>光子<b class='flag-5'>激光雷达</b>系统用于实现高分辨率<b class='flag-5'>3D</b>成像

    大陆集团的3D Flash激光雷达有何优势?

    在这一技术革命的前沿,激光雷达成为了不可或缺的一环。而在这其中,大陆集团的3D Flash激光雷达引人瞩目。
    发表于 04-11 10:28 332次阅读
    大陆集团的<b class='flag-5'>3D</b> Flash<b class='flag-5'>激光雷达</b>有何优势?

    华为详细解读激光雷达

    来源:华为智能汽车解决方案,谢谢 编辑:感知芯视界 Link 激光雷达(LiDAR)作为智能驾驶系统的核心传感器,其三维环境重建能力为车辆提供了丰富而精确的环境信息,主动发光,不受黑夜光照条件
    的头像 发表于 03-15 10:19 601次阅读

    亮道智能:发布全新一代激光雷达,未来主攻固态激光雷达低价市场

    亮道智能官方透露该公司已为众多行业客户提供全面的激光雷达感知解决方案,包括车规级激光雷达硬件及其感知功能开发、测试验证及数据服务。
    的头像 发表于 03-06 15:22 660次阅读

    速腾聚创发布首款超长距激光雷达M3

    近日,2024年国际消费电子展(CES 2024)在美国拉斯维加斯落下帷幕。作为激光雷达感知解决方案市场的全球领导者,RoboSense速腾聚创在此次展会上展示了其全系车规级高性能激光雷达产品,其中最引人注目的是M平台首款超长
    的头像 发表于 01-18 14:32 891次阅读

    MEMS激光雷达初创公司Blickfeld获750万欧元新融资

    投资者通过增加对MEMS激光雷达初创公司Blickfeld的投资,帮助其提高智能激光雷达产品的市场渗透率,为供应链和安全应用提供突破性实时3D信息。
    的头像 发表于 12-22 10:06 849次阅读

    STRADVISION“3D感知网络”,引领ADAS领域革命浪潮

    STRADVISION开发的3D感知网络代表了高级驾驶辅助系统/自动驾驶领域的重大进步。该创新方法在开发阶段利用了激光雷达(LiDAR),但其与众不同之处在于它能够过渡成为一种强大而经济的替代方案,从而消除了对车载
    发表于 12-19 10:39 384次阅读
    STRADVISION“<b class='flag-5'>3D</b><b class='flag-5'>感知</b>网络”,引领ADAS领域革命浪潮

    单线激光雷达和多线激光雷达区别

    单线激光雷达和多线激光雷达区别  单线激光雷达和多线激光雷达是两种常用的激光雷达技术。它们在激光
    的头像 发表于 12-07 15:48 4267次阅读