0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何学习基于Tansformer的目标检测算法呢?

3D视觉工坊 来源:3D视觉工坊 2023-08-07 16:34 次阅读

说到纯视觉的自动驾驶方案,大家第一个想到的就是Tesla吧。的确,早在2021年,Tesla就已经实现了纯视觉的BEV检测方案,而且效果非常好。

240e9aa2-32e1-11ee-9e74-dac502259ad0.png

细心的同学可能发现了,这套BEV方案中将相机空间的图像转换到BEV空间的核心组件就是Transformer。

Transformer来源于自然语言处理领域,首先被应用于机器翻译。后来,大家发现它在计算机视觉领域效果也很不错,而且在各大排行榜上碾压CNN网络

2435d4a0-32e1-11ee-9e74-dac502259ad0.png

目标检测领域中,视觉Transformer不仅可以实现2D检测、3D检测,还可以实现多模态检测,BEV视角下的检测,性能也非常出色。

245b52ac-32e1-11ee-9e74-dac502259ad0.png

因此,掌握Transformer相关知识和工程基础成为了企业招聘算法工程师的一个技能要求点,也是简历上的一个很大的加分项。

然而,想要掌握基于Transformer的目标检测算法,有以下3个难点

理解Transformer背后的理论基础,比如自注意力机制(self-attention), 位置编码(positional embedding),目标查询(object query)等等,网上的资料比较杂乱,不够系统,难以通过自学做到深入理解并融会贯通。

2475f544-32e1-11ee-9e74-dac502259ad0.png

掌握基于Transformer的目标检测算法的思路和创新点,一些Transformer论文涉及的新概念比较多,话术没有那么通俗易懂,读完论文仍然不理解算法的细节部分。

24a3cd02-32e1-11ee-9e74-dac502259ad0.png2

Transformer代码不易看懂,因为作用机制与CNN有不少差别,所以完全理解代码并实践应用需要花费很大功夫。

24c35ec4-32e1-11ee-9e74-dac502259ad0.png3

那么如何学习基于Tansformer的目标检测算法呢?

实践部分

24d6a84e-32e1-11ee-9e74-dac502259ad0.png24fc84a6-32e1-11ee-9e74-dac502259ad0.png






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    8

    文章

    1613

    浏览量

    45717
  • 自动驾驶
    +关注

    关注

    776

    文章

    13246

    浏览量

    164137
  • Transformer
    +关注

    关注

    0

    文章

    131

    浏览量

    5916

原文标题:Transformer在自动驾驶中的应用前景怎么样?

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    人员跌倒识别检测算法

    人员跌倒识别检测算法是基于视频的检测方法,通过对目标人体监测,当目标人体出现突然倒地行为时,自动监测并触发报警。人员跌倒识别检测算法基于计算
    的头像 发表于 06-30 11:47 40次阅读
    人员跌倒识别<b class='flag-5'>检测算法</b>

    深度学习检测目标常用方法

    深度学习的效果在某种意义上是靠大量数据喂出来的,小目标检测的性能同样也可以通过增加训练集中小目标样本的种类和数量来提升。
    发表于 03-18 09:57 480次阅读
    深度<b class='flag-5'>学习</b><b class='flag-5'>检测</b>小<b class='flag-5'>目标</b>常用方法

    一种可靠的峰值和起始点检测算法

    电子发烧友网站提供《一种可靠的峰值和起始点检测算法.pdf》资料免费下载
    发表于 11-22 10:27 0次下载
    一种可靠的峰值和起始点<b class='flag-5'>检测算法</b>

    基于NXP微控制器i.MX RT1170的多人体实时检测算法和系统

    基于NXP微控制器i.MX RT1170的多人体实时检测算法和系统
    的头像 发表于 10-26 16:27 804次阅读
    基于NXP微控制器i.MX RT1170的多人体实时<b class='flag-5'>检测算法</b>和系统

    基于C8051F310的高灵敏车辆检测算法

    电子发烧友网站提供《基于C8051F310的高灵敏车辆检测算法.pdf》资料免费下载
    发表于 10-18 11:00 0次下载
    基于C8051F310的高灵敏车辆<b class='flag-5'>检测算法</b>

    基于Delaunay三角剖分的空间离群点检测算法研究

    电子发烧友网站提供《基于Delaunay三角剖分的空间离群点检测算法研究.pdf》资料免费下载
    发表于 10-07 11:15 0次下载

    智慧矿山ai算法系列解析 堵料检测算法功能优势

    智慧矿山AI算法系列中的堵料检测算法的功能优势,了解其重要性和带来的价值
    的头像 发表于 09-28 18:48 433次阅读
    智慧矿山ai<b class='flag-5'>算法</b>系列解析 堵料<b class='flag-5'>检测算法</b>功能优势

    基于Anomalib和AI x Board的SIMOTECH在线缺陷检测系统

    Anomalib 是一个深度学习库,旨在收集最先进的异常检测算法,以便在公共和私有数据集上进行基准测试。Anomalib 提供了近期文献中描述的异常检测算法的几种即用型实现,以及一套便于开发和实现自定义模型的工具。该库重点关注基
    的头像 发表于 09-01 10:23 549次阅读
    基于Anomalib和AI x Board的SIMOTECH在线缺陷<b class='flag-5'>检测</b>系统

    基于Transformer的目标检测算法难点

    理解Transformer背后的理论基础,比如自注意力机制(self-attention), 位置编码(positional embedding),目标查询(object query)等等,网上的资料比较杂乱,不够系统,难以通过自学做到深入理解并融会贯通。
    发表于 08-24 11:19 207次阅读
    基于Transformer的<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>难点

    机器学习有哪些算法?机器学习分类算法有哪些?机器学习预判有哪些算法

    有许多不同的类型和应用。根据机器学习的任务类型,可以将其分为几种不同的算法类型。本文将介绍机器学习算法类型以及分类算法和预
    的头像 发表于 08-17 16:30 1610次阅读

    基于Transformer的目标检测算法

    掌握基于Transformer的目标检测算法的思路和创新点,一些Transformer论文涉及的新概念比较多,话术没有那么通俗易懂,读完论文仍然不理解算法的细节部分。
    发表于 08-16 10:51 502次阅读
    基于Transformer的<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>

    基于强化学习目标检测算法案例

    摘要:基于强化学习目标检测算法检测过程中通常采用预定义搜索行为,其产生的候选区域形状和尺寸变化单一,导致目标
    发表于 07-19 14:35 0次下载

    基于Transformer的目标检测算法的3个难点

    理解Transformer背后的理论基础,比如自注意力机制(self-attention), 位置编码(positional embedding),目标查询(object query)等等,网上的资料比较杂乱,不够系统,难以通过自学做到深入理解并融会贯通。
    发表于 07-18 12:54 534次阅读
    基于Transformer的<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>的3个难点

    无Anchor的目标检测算法边框回归策略

    导读 本文主要讲述:1.无Anchor的目标检测算法:YOLOv1,CenterNet,CornerNet的边框回归策略;2.有Anchor的目标检测算法:SSD,YOLOv2,Fas
    的头像 发表于 07-17 11:17 752次阅读
    无Anchor的<b class='flag-5'>目标</b><b class='flag-5'>检测算法</b>边框回归策略

    基于深度学习模型融合的产品工艺缺陷检测算法简述

     基于深度学习模型融合的工业产品(零部件)工艺缺陷检测算法简述 1、序言 随着信息与智能化社会的到来,工业产品生产逐渐走向智能化生产,极大地提高了生产力。但是随着工人大规模解放,产品或零部件的缺陷
    的头像 发表于 07-06 14:49 445次阅读
    基于深度<b class='flag-5'>学习</b>模型融合的产品工艺缺陷<b class='flag-5'>检测算法</b>简述