0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用于自动驾驶的时空融合激光雷达地点识别算法SeqOT

3D视觉工坊 来源:计算机视觉工坊 作者:马君驿 2022-12-09 10:01 次阅读

论文作者:Junyi Ma, Xieyuanli Chen, Jingyi Xu, Guangming Xiong∗

论文来源:IEEE Transactions on Industrial Electronics

1、摘要

在本文中,作者在其原有工作OverlapTransformer (OT)的基础上,提出了一种用于自动驾驶的时空融合激光雷达地点识别算法SeqOT。SeqOT以多帧激光雷达数据作为输入,使用端到端的方式直接为序列化数据提取全局描述子,用以快速的地点识别检索。SeqOT采用多尺度Transformer结构对单帧高阶特征与多帧高阶特征进行增强和融合,并使用池化结构对多帧子描述子进行降维,显著提升地点识别描述子特异性和实时性。此外,SeqOT具有yaw角旋转不变和激光序列顺序不变的结构,进一步提高自动驾驶车辆多角度地点识别的准确率。试验结果表明,SeqOT在长、短时间跨度数据集上均具有很好的识别性能,且其运行速度快于激光雷达帧率,适用于实时运行的自动驾驶车辆。

2、主要工作与贡献

本文的主要贡献是一个端到端的地点识别神经网络,它利用连续的range image实现可靠的长期地点识别。受益于所提出的yaw角旋转不变结构,SeqOT对视点变化和多帧激光雷达数据的输入顺序具有较强的鲁棒性,因此即使在自动驾驶车辆以相反方向行驶时也能实现可靠的地点识别。SeqOT利用多尺度Transformer模块来融合序列化激光雷达数据的时空信息,通过增强单帧内部特征的关联与多帧间特征的关联,增强地点描述子特异性,进而提升地点识别精度。

3、算法流程

38896004-775f-11ed-8abf-dac502259ad0.png

图1 SeqOT算法结构

SeqOT由单帧编码模块、多帧编码模块,以及池化模块组合而成。如图1所示,首先将多帧三维激光点云通过球面投影转换为多帧二维range image,然后将各帧range image输入到单帧编码模块中,分别进行空间维度的压缩和通道维度的扩张,再利用单帧Transformer模块进行特征图的特异性增强,然后将特异性增强后的结果与增强前的结果进行通道维度上的拼接。以上操作均对序列化激光信息中的单帧数据分别进行操作。接下来,将单帧编码模块输出的特征输入到多帧编码模块中,在将相邻帧特征进行拼接后,输入到多帧Transformer模块进行多帧信息的高阶特征融合与增强,然后将融合后的结果输入到NetVLAD结构中生成一系列维度为1x256的子描述子向量。池化模块将此输入激光序列中的全部子描述子进行池化压缩,为输入激光序列生成最终的1x256全局描述子向量。

球面投影与yaw角旋转等变性

SeqOT使用序列化range image作为输入,并充分利用其yaw角旋转等变性。一个三维激光点(x, y, z),通过如下公式就可以投影至一个二维的图像像素(u, v),这就是球面投影生成range image的过程。range image上的每个像素点都代表激光点的距离信息。

389cf970-775f-11ed-8abf-dac502259ad0.png

range image本身具备yaw角旋转等变性,即一帧激光点云相对于z轴的旋转等价于本帧range image的平移。图2展示了yaw角旋转等变的简单示例。

38b1ce36-775f-11ed-8abf-dac502259ad0.png

图2 yaw角旋转等变性示例

得益于三维点云绕z轴的旋转等价于range image的平移,SeqOT后续的结构能够输出一系列yaw角旋转等变的中间特征图,进而最终将yaw角旋转等变性转化为yaw角旋转不变性,输出不受视点变化影响的全局描述子,从而保证多角度地点识别的可行性。

单帧编码模块

单帧编码模块对输入序列激光帧的每一帧单独进行高阶特征提取。基于此前的工作[1],单帧编码模块使用了与OverlapTransformer相似的OverlapNetLeg对range image进行高度方向的压缩与通道维度的扩张。而后的单帧Transformer模块对OverlapNetLeg的输出进行特异性增强,即增强单帧激光内部不同特征之间的关联。增强后的特征与增强前的特征进行拼接,得到yaw角旋转等变的中间特征,输入到后续的多帧编码模块。

多帧编码模块与池化模块

多帧编码模块将连续帧经过单帧编码模块输出的序列化高阶特征进行初步融合,池化模块则对初步融合的特征进行描述子级的聚合,最终为序列化输入计算地点识别描述子。在多帧编码模块中,首先将相邻三帧点云对应的单帧编码模块的输出进行拼接,构成更长的特征编码,输入至多帧Transformer模块,对帧间特征关联进行增强,实现多帧信息的融合。序列化信息融合后的特征输入至NetVLAD结构中,提取一系列子描述子。池化模块最终将序列子描述子进行聚合,生成一维地点识别全局描述子。由于结构中使用了具有顺序不变性质的NetVLAD结构与GeM池化结构,因此最终输出的全局描述子具备yaw角旋转不变性和激光序列顺序不变性,示例如图3所示,相关证明详见论文。

38fadb3a-775f-11ed-8abf-dac502259ad0.png

图3 全局描述子yaw角旋转不变性示例

基于overlap的训练

与此前工作[1]类似,SeqOT利用基于overlap划分的数据集进行训练。利用overlap作为label进行训练的理念在OverlapNet论文[2]中有所阐述。训练过程采用对比学习的思路,对于一帧query点云,同时向SeqOT输入本帧点云对应的序列激光帧、以及它的kp个正样本序列和kn个负样本序列。基于overlap的triplet loss函数如下式所示。

3912427a-775f-11ed-8abf-dac502259ad0.png

使用overlap而不是点云之间的距离作为衡量正负样本的基准,是因为overlap对于描述激光点云相似度来说是一个更为自然的方式;此外,点云间的overlap对应了后续点云配准的质量,因此基于overlap对是否为同一地点进行判断更有益于后续算法的进行。此外,本工作面向自动驾驶车辆地点识别最常用场景——可重复性行驶环境,为低显存的嵌入式设备提供了更为节省资源的两步训练策略,即第一步:将triplet loss作用于多帧编码模块输出的子描述子,训练池化模块之前的模型,并保存训练使用的子描述子;第二步:利用保存的子描述子作为输入,将triplet loss作用于SeqOT最终输出的全局描述子,训练池化模块。

4、实验结果

毫末数据集上的地点识别结果

3924b3ce-775f-11ed-8abf-dac502259ad0.png

KITTI和MulRan数据集上的泛化性测试结果

3944d8a2-775f-11ed-8abf-dac502259ad0.png

396889fa-775f-11ed-8abf-dac502259ad0.png

输入序列长度的对比试验结果

398decae-775f-11ed-8abf-dac502259ad0.png

多尺度Transformer的消融试验结果

39b77cea-775f-11ed-8abf-dac502259ad0.png

yaw角旋转不变性验证

39dd84ee-775f-11ed-8abf-dac502259ad0.png

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4651

    浏览量

    99487
  • 激光雷达
    +关注

    关注

    966

    文章

    3777

    浏览量

    187781
  • 自动驾驶
    +关注

    关注

    776

    文章

    13253

    浏览量

    164160

原文标题:SeqOT: 基于时空融合Transformer的SOTA地点识别算法,代码开源(IEEE Trans2022)

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    自动驾驶激光雷达及非硅15W高导热绝缘氮化硼材料介绍

    路线之争。技术路线之争往大了看有单车智能和车路协同之争、有纯视觉和多传感器融合之争、有依赖高精地图和不依赖高精地图之争……,往小了看有激光雷达布置位置之争、有行泊一
    的头像 发表于 04-24 10:00 245次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>激光雷达</b>及非硅15W高导热绝缘氮化硼材料介绍

    阜时科技近期签订商用车自动驾驶全固态激光雷达批量订单

    阜时科技战略合作的某头部激光雷达(LiDAR)公司,签订商用车自动驾驶全固态激光雷达批量订单,近期将陆续交付。
    的头像 发表于 04-11 14:08 763次阅读

    未来已来,多传感器融合感知是自动驾驶破局的关键

    模态精准感知信息,使自动驾驶系统可以实时精准地感知道路上的各种状况。 昱感微融合感知产品方案创新性地 将可见光摄像头、红外摄像头以及4D毫米波雷达的探测数据在前端(数据获取时)交互,将各传感器的探测
    发表于 04-11 10:26

    激光雷达的应用场景

    激光雷达在多个领域中都有着广泛的应用。以下是几个主要的应用场景: 自动驾驶汽车:激光雷达自动驾驶汽车中起到了至关重要的作用。它可以帮助车辆检测和
    的头像 发表于 04-10 14:59 505次阅读

    硅基片上激光雷达技术综述

    硅基光电子技术的发展可以将激光雷达系统发射模块和接收模块中分立的有源和无源器件集成在芯片上,使激光雷达体积更小、稳定性更强、成本更低,推动激光雷达自动驾驶等领域的应用。
    的头像 发表于 04-08 10:25 456次阅读
    硅基片上<b class='flag-5'>激光雷达</b>技术综述

    硅基片上激光雷达的测距原理

    硅基光电子技术的发展可以将激光雷达系统发射模块和接收模块中分立的有源和无源器件集成在芯片上,使激光雷达体积更小、稳定性更强、成本更低,推动激光雷达自动驾驶等领域的应用。
    发表于 04-08 10:23 252次阅读
    硅基片上<b class='flag-5'>激光雷达</b>的测距原理

    激光雷达的应用场景

    景: 大气环境监测 :激光雷达成为对大气进行高精度遥感探测的有效手段。它可以探测气溶胶、云粒子的分布、大气成分和风场的垂直廓线,对主要污染源进行有效监控。 自动驾驶汽车 :激光雷达自动驾驶
    的头像 发表于 03-21 10:38 570次阅读

    LabVIEW开发自动驾驶的双目测距系统

    挑战,包括激光雷达、单目测距和双目视觉技术等。在当前的高级辅助驾驶技术(ADAS)中,双目视觉技术在距离检测方面表现出色,它可以精确地测量物体的距离,提供更客观的数据。 为了应对这一需求,设计了一种
    发表于 12-19 18:02

    宝马发力L3自动驾驶,摩根大通看好,激光雷达公司再迎暴涨

    来源:激光雷达老炮儿 (略有删改)  2023年12月14日,宝马集团官方宣布,其搭载L3级别自动驾驶功能的车辆在上海市正式获得高快速路自动驾驶测试牌照。未来,宝马将在上海市政府的监督和指导下
    的头像 发表于 12-15 08:38 446次阅读
    宝马发力L3<b class='flag-5'>自动驾驶</b>,摩根大通看好,<b class='flag-5'>激光雷达</b>公司再迎暴涨

    激光雷达和毫米波雷达的区别 哪个才是自动驾驶感知的最优选择?

    激光雷达和毫米波雷达的区别 哪个才是自动驾驶感知的最优选择? 激光雷达和毫米波雷达自动驾驶车辆
    的头像 发表于 11-22 17:41 6622次阅读

    自动驾驶激光雷达和纯计算机视觉对比分析

    本文将对激光雷达、摄像头以及毫米波雷达等主流传感器、各自动驾驶公司的解决方案以及传感器市场格局作介绍。
    发表于 10-16 11:47 2198次阅读
    <b class='flag-5'>自动驾驶</b>的<b class='flag-5'>激光雷达</b>和纯计算机视觉对比分析

    一文通过AEC-Q102车规级芯片测试认证了解激光雷达核心技术及行业格局

    ,甚至前车的下方空间进行探测,为视觉系统提供更丰富的数据。 激光雷达被认为是 L3 级及以上自动驾驶必备传感器。激光雷达兼具测距远、角度分辨率优、受环境光照影响小的特点,且无需深度学习算法
    发表于 09-19 13:35

    补盲激光雷达,照亮自动驾驶隐秘的角落

    4颗激光雷达的车型可以完全覆盖车辆前、后、左、右四个方向,而3颗激光雷达的布置舍弃了后向,1颗或者2颗激光雷达的车型都将雷达布置在前向,但2颗激光雷
    的头像 发表于 08-23 09:30 1006次阅读
    补盲<b class='flag-5'>激光雷达</b>,照亮<b class='flag-5'>自动驾驶</b>隐秘的角落

    目前已经量产的固态激光雷达有哪些?

    虚拟环境。固态激光雷达是一种强劲、灵活和精确的先进传感技术,尤其适用于自动驾驶汽车。 由于它们可以通过检测光的反射来确定物体的位置,因此可以用作自动驾驶汽车的关键系统。这种技术还可以在
    的头像 发表于 08-22 16:45 869次阅读

    激光雷达是什么 激光雷达介绍

    激光雷达自动驾驶应用中主要用来探测道路上的障碍物信息,把数据和信号传递给自动驾驶的大脑,再做出相应的驾驶动作,但室外常见的干扰因素如雨、雾、雪、粉尘、高低温等对
    的头像 发表于 07-14 11:11 3803次阅读