0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

掌握基于Transformer的目标检测算法的3个难点

3D视觉工坊 来源:3D视觉工坊 2023-08-22 14:52 次阅读

说到纯视觉的自动驾驶方案,大家第一个想到的就是Tesla吧。的确,早在2021年,Tesla就已经实现了纯视觉的BEV检测方案,而且效果非常好。

849d2c6e-4077-11ee-ac96-dac502259ad0.png

细心的同学可能发现了,这套BEV方案中将相机空间的图像转换到BEV空间的核心组件就是Transformer。

Transformer来源于自然语言处理领域,首先被应用于机器翻译。后来,大家发现它在计算机视觉领域效果也很不错,而且在各大排行榜上碾压CNN网络

84cb9392-4077-11ee-ac96-dac502259ad0.png

目标检测领域中,视觉Transformer不仅可以实现2D检测、3D检测,还可以实现多模态检测,BEV视角下的检测,性能也非常出色。

84ec0938-4077-11ee-ac96-dac502259ad0.png

因此,掌握Transformer相关知识和工程基础成为了企业招聘算法工程师的一个技能要求点,也是简历上的一个很大的加分项。

然而,想要掌握基于Transformer的目标检测算法,有以下3个难点:

理解Transformer背后的理论基础,比如自注意力机制(self-attention), 位置编码(positional embedding),目标查询(object query)等等,网上的资料比较杂乱,不够系统,难以通过自学做到深入理解并融会贯通。

85767a5a-4077-11ee-ac96-dac502259ad0.png

掌握基于Transformer的目标检测算法的思路和创新点,一些Transformer论文涉及的新概念比较多,话术没有那么通俗易懂,读完论文仍然不理解算法的细节部分。

858fef4e-4077-11ee-ac96-dac502259ad0.png

2

Transformer代码不易看懂,因为作用机制与CNN有不少差别,所以完全理解代码并实践应用需要花费很大功夫。

85c18b12-4077-11ee-ac96-dac502259ad0.png

3

那么如何学习基于Tansformer的目标检测算法呢?

3D视觉工坊联合讲师「语嫣」,为大家精心准备了课程「目标检测中的视觉Transformer」,主要帮助各位同学解决以上这些难点。

不仅为大家详细讲解视觉Transformer的基础知识,各种经典的基于Transformer的目标检测算法,还配有代码解读和实践课程,让大家真正活学活用,理解和掌握这些知识理论。

实践部分

85d60704-4077-11ee-ac96-dac502259ad0.png

85ebf30c-4077-11ee-ac96-dac502259ad0.png


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器翻译
    +关注

    关注

    0

    文章

    139

    浏览量

    14880
  • Transformer
    +关注

    关注

    0

    文章

    143

    浏览量

    5995
  • 自然语言处理

    关注

    1

    文章

    618

    浏览量

    13552

原文标题:视觉Transformer,火了

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于深度学习的目标检测算法解析

    本节主要将近年来基于候选区域的目标检测算法分为五部分进行综述,首先介绍了Faster R-CNN[14]框架的发展历程,然后综述了对Faster R-CNN算法的四
    发表于 01-09 10:52 1161次阅读

    PowerPC小目标检测算法怎么实现?

    检测系统在低功耗、轻小型化等方面提出了更高的要求。因此,完成小目标检测任务不仅需要寻求合理的小目标检测算法,在实现时还需要考虑处理性能和体积
    发表于 08-09 07:07

    求一种基于机载单通道SAR数据的地面运动目标检测算法

    两通道DPCA动目标检测原理是什么?基于机载单通道SAR数据的地面运动目标检测算法
    发表于 06-03 06:04

    基于YOLOX目标检测算法的改进

    实时性的前提下,进一步提升了近两百分点的精度。在本文的研究中,基于 YOLOX 目标检测算法 进行损失函数的优化,以改善遮挡目标和小目标
    发表于 03-06 13:55

    基于像素分类的运动目标检测算法

    针对复杂环境下运动目标检测提出一种基于像素分类的运动目标检测算法。该算法通过亮度归一化对图像序列进行预处理,用以降低光照变化造成的误检,根据
    发表于 04-10 08:51 4次下载

    基于码本模型的运动目标检测算法

    本内容提供了基于码本模型的运动目标检测算法
    发表于 05-19 10:54 32次下载
    基于码本模型的运动<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>

    改进的ViBe运动目标检测算法_刘春

    改进的ViBe运动目标检测算法_刘春
    发表于 03-19 11:41 0次下载

    基于深度学习的目标检测算法

    整体框架 目标检测算法主要包括:【两阶段】目标检测算法、【多阶段】目标检测算法、【单阶段】
    的头像 发表于 04-30 10:22 1.1w次阅读
    基于深度学习的<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>

    浅谈红外弱小目标检测算法

    红外单帧弱小目标检测算法主要通过图像预处理突出小目标同时抑制背景噪声干扰,之后采用阈值分割提取疑似目标,最后根据特征信息进行目标确认。
    的头像 发表于 08-04 17:20 6064次阅读

    快速入门自动驾驶中目标检测算法

    现在目标检测算法总结 1. 目标检测算法在机动车和行人检测识别上应用较多,在非机动车上应用较少 2. 对于
    发表于 06-06 09:40 0次下载
    快速入门自动驾驶中<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>

    无Anchor的目标检测算法边框回归策略

    导读 本文主要讲述:1.无Anchor的目标检测算法:YOLOv1,CenterNet,CornerNet的边框回归策略;2.有Anchor的目标检测算法:SSD,YOLOv2,Fas
    的头像 发表于 07-17 11:17 1069次阅读
    无Anchor的<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>边框回归策略

    基于Transformer目标检测算法3难点

    理解Transformer背后的理论基础,比如自注意力机制(self-attention), 位置编码(positional embedding),目标查询(object query)等等,网上的资料比较杂乱,不够系统,难以通过自学做到深入理解并融会贯通。
    发表于 07-18 12:54 676次阅读
    基于<b class='flag-5'>Transformer</b>的<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>的<b class='flag-5'>3</b><b class='flag-5'>个</b><b class='flag-5'>难点</b>

    基于强化学习的目标检测算法案例

    强化学习的目标检测算法。首先,深度强化学习agent根据初始候选区域所提取的信息决定相应搜索行动,根据行动选择下一逼近真实目标的候选区域;然后,重复上述过程,直至agent能确定当前
    发表于 07-19 14:35 0次下载

    基于Transformer目标检测算法

    掌握基于Transformer目标检测算法的思路和创新点,一些Transformer论文涉及的新概念比较多,话术没有那么通俗易懂,读完论文
    发表于 08-16 10:51 649次阅读
    基于<b class='flag-5'>Transformer</b>的<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>

    基于Transformer目标检测算法难点

    理解Transformer背后的理论基础,比如自注意力机制(self-attention), 位置编码(positional embedding),目标查询(object query)等等,网上的资料比较杂乱,不够系统,难以通过自学做到深入理解并融会贯通。
    发表于 08-24 11:19 305次阅读
    基于<b class='flag-5'>Transformer</b>的<b class='flag-5'>目标</b><b class='flag-5'>检测算法难点</b>