0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

掌握基于Transformer的目标检测算法的3个难点

3D视觉工坊 来源:3D视觉工坊 2023-08-22 14:52 次阅读

说到纯视觉的自动驾驶方案,大家第一个想到的就是Tesla吧。的确,早在2021年,Tesla就已经实现了纯视觉的BEV检测方案,而且效果非常好。

849d2c6e-4077-11ee-ac96-dac502259ad0.png

细心的同学可能发现了,这套BEV方案中将相机空间的图像转换到BEV空间的核心组件就是Transformer。

Transformer来源于自然语言处理领域,首先被应用于机器翻译。后来,大家发现它在计算机视觉领域效果也很不错,而且在各大排行榜上碾压CNN网络

84cb9392-4077-11ee-ac96-dac502259ad0.png

目标检测领域中,视觉Transformer不仅可以实现2D检测、3D检测,还可以实现多模态检测,BEV视角下的检测,性能也非常出色。

84ec0938-4077-11ee-ac96-dac502259ad0.png

因此,掌握Transformer相关知识和工程基础成为了企业招聘算法工程师的一个技能要求点,也是简历上的一个很大的加分项。

然而,想要掌握基于Transformer的目标检测算法,有以下3个难点:

理解Transformer背后的理论基础,比如自注意力机制(self-attention), 位置编码(positional embedding),目标查询(object query)等等,网上的资料比较杂乱,不够系统,难以通过自学做到深入理解并融会贯通。

85767a5a-4077-11ee-ac96-dac502259ad0.png

掌握基于Transformer的目标检测算法的思路和创新点,一些Transformer论文涉及的新概念比较多,话术没有那么通俗易懂,读完论文仍然不理解算法的细节部分。

858fef4e-4077-11ee-ac96-dac502259ad0.png

2

Transformer代码不易看懂,因为作用机制与CNN有不少差别,所以完全理解代码并实践应用需要花费很大功夫。

85c18b12-4077-11ee-ac96-dac502259ad0.png

3

那么如何学习基于Tansformer的目标检测算法呢?

3D视觉工坊联合讲师「语嫣」,为大家精心准备了课程「目标检测中的视觉Transformer」,主要帮助各位同学解决以上这些难点。

不仅为大家详细讲解视觉Transformer的基础知识,各种经典的基于Transformer的目标检测算法,还配有代码解读和实践课程,让大家真正活学活用,理解和掌握这些知识理论。

实践部分

85d60704-4077-11ee-ac96-dac502259ad0.png

85ebf30c-4077-11ee-ac96-dac502259ad0.png


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器翻译
    +关注

    关注

    0

    文章

    138

    浏览量

    14815
  • Transformer
    +关注

    关注

    0

    文章

    132

    浏览量

    5916
  • 自然语言处理

    关注

    1

    文章

    521

    浏览量

    13275

原文标题:视觉Transformer,火了

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    人脸检测算法及新的快速算法

    人脸检测算法及新的快速算法人脸识别设备凭借着便捷的应用,以及更加新潮的技术,俘获了不少人的好感。于是,它的应用也在日益的变得更加的广泛。由中国电子学会主办的全国图形图像技术应用大会,行业专家将介绍
    发表于 09-26 15:13

    PowerPC小目标检测算法怎么实现?

    检测系统在低功耗、轻小型化等方面提出了更高的要求。因此,完成小目标检测任务不仅需要寻求合理的小目标检测算法,在实现时还需要考虑处理性能和体积
    发表于 08-09 07:07

    求一种基于机载单通道SAR数据的地面运动目标检测算法

    两通道DPCA动目标检测原理是什么?基于机载单通道SAR数据的地面运动目标检测算法
    发表于 06-03 06:04

    基于YOLOX目标检测算法的改进

    实时性的前提下,进一步提升了近两百分点的精度。在本文的研究中,基于 YOLOX 目标检测算法 进行损失函数的优化,以改善遮挡目标和小目标
    发表于 03-06 13:55

    基于像素分类的运动目标检测算法

    针对复杂环境下运动目标检测提出一种基于像素分类的运动目标检测算法。该算法通过亮度归一化对图像序列进行预处理,用以降低光照变化造成的误检,根据
    发表于 04-10 08:51 4次下载

    基于码本模型的运动目标检测算法

    本内容提供了基于码本模型的运动目标检测算法
    发表于 05-19 10:54 32次下载
    基于码本模型的运动<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>

    改进的ViBe运动目标检测算法_刘春

    改进的ViBe运动目标检测算法_刘春
    发表于 03-19 11:41 0次下载

    基于深度学习的目标检测算法

    整体框架 目标检测算法主要包括:【两阶段】目标检测算法、【多阶段】目标检测算法、【单阶段】
    的头像 发表于 04-30 10:22 1w次阅读
    基于深度学习的<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>

    一种改进的单激发探测器小目标检测算法

    基于单激发探测器(SSD)的小目标检测算法实时性较差且检测精度较低。为提高小目标检测精度和鲁棒性提出一种结合改进密集网络和二次回归的小
    发表于 05-27 14:32 5次下载

    一种改进的高光谱图像CEM目标检测算法

    一种改进的高光谱图像CEM目标检测算法   来源:《 应用物理》 ,作者付铜铜等 摘要:  约束能量最小化(Constrained Energy Minimization, CEM)目标检测算
    发表于 03-05 15:47 1062次阅读
    一种改进的高光谱图像CEM<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>

    浅谈红外弱小目标检测算法

    红外单帧弱小目标检测算法主要通过图像预处理突出小目标同时抑制背景噪声干扰,之后采用阈值分割提取疑似目标,最后根据特征信息进行目标确认。
    的头像 发表于 08-04 17:20 5074次阅读

    无Anchor的目标检测算法边框回归策略

    导读 本文主要讲述:1.无Anchor的目标检测算法:YOLOv1,CenterNet,CornerNet的边框回归策略;2.有Anchor的目标检测算法:SSD,YOLOv2,Fas
    的头像 发表于 07-17 11:17 753次阅读
    无Anchor的<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>边框回归策略

    基于Transformer目标检测算法的3个难点

    理解Transformer背后的理论基础,比如自注意力机制(self-attention), 位置编码(positional embedding),目标查询(object query)等等,网上的资料比较杂乱,不够系统,难以通过自学做到深入理解并融会贯通。
    发表于 07-18 12:54 535次阅读
    基于<b class='flag-5'>Transformer</b>的<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>的3个<b class='flag-5'>难点</b>

    基于Transformer目标检测算法

    掌握基于Transformer目标检测算法的思路和创新点,一些Transformer论文涉及的新概念比较多,话术没有那么通俗易懂,读完论文
    发表于 08-16 10:51 502次阅读
    基于<b class='flag-5'>Transformer</b>的<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>

    基于Transformer目标检测算法难点

    理解Transformer背后的理论基础,比如自注意力机制(self-attention), 位置编码(positional embedding),目标查询(object query)等等,网上的资料比较杂乱,不够系统,难以通过自学做到深入理解并融会贯通。
    发表于 08-24 11:19 208次阅读
    基于<b class='flag-5'>Transformer</b>的<b class='flag-5'>目标</b><b class='flag-5'>检测算法难点</b>