如何入门面向自动驾驶领域的视觉Transformer？-电子发烧友网

视觉感知算法的核心在于精准实时地感知周围环境，以便下游更好地进行决策规划，而目标检测任务就是视觉感知的基础。不仅在自动驾驶领域，在机器人导航、工业检测、视频监控等领域，目标检测都有着广泛应用，也是近年来理论研究的热点。作为计算机视觉中的基础算法，目标检测对后续的人脸识别、目标跟踪、实例分割等任务都起着至关重要的作用。

基于深度学习的卷积学习网络（CNN）在目标检测任务上取得了优越的性能，例如FasterRCNN、YOLO系列、CenterNet等等，也在实际应用中实现了成功部署和使用。自Transformer在2017年被提出之后，无论是自然语言处理领域，还是计算机视觉 (CV)、强化学习 (RL)、生成对抗网络 (GAN)、语音处理甚至是生物学领域，Transformer都大放异彩。而在目标检测领域中，视觉Transformer不仅可以实现2D检测、3D检测，还可以实现多模态检测，BEV视角下的检测，性能也非常出色。因此，掌握Transformer相关知识和工程基础成为了企业招聘算法工程师的一个技能要求点，也是简历上的一个加分项。

然而，想要掌握基于Transformer的目标检测算法，有以下3个难点：

理解Transformer背后的理论基础，比如自注意力机制（self-attention）, 位置编码（positional embedding），目标查询（object query）等等，网上的资料比较杂乱，不够系统，难以通过自学做到深入理解并融会贯通。

掌握基于Transformer的目标检测算法的思路和创新点，一些Transformer论文涉及的新概念比较多，话术没有那么通俗易懂，读完论文仍然不理解算法的细节部分。

Transformer代码不易看懂，因为作用机制与CNN有不少差别，所以完全理解代码并实践应用需要花费很大功夫。

那么如何学习基于Tansformer的目标检测算法呢？

课程「目标检测中的视觉Transformer」正是帮助各位同学解决以上这些难点，不仅为大家详细讲解视觉Transformer的基础知识，还有各种经典的基于Transformer的目标检测算法，还配有代码解读和实践课程，让大家真正活学活用，理解和掌握这些知识理论。

实践部分

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

自动驾驶

自动驾驶

+关注

关注
784

文章
13779

浏览量
166350
深度学习

深度学习

+关注

关注
73

文章
5497

浏览量
121095
Transformer

Transformer

+关注

关注
0

文章
143

浏览量
5995

原文标题：如何入门面向自动驾驶领域的视觉Transformer？

文章出处：【微信号：3D视觉工坊，微信公众号：3D视觉工坊】欢迎添加关注！文章转载请注明出处。

机器视觉在自动驾驶中的应用

如果能够将人类视觉系统应用到自动驾驶领域，无疑将会大幅度提高自动驾驶的准确性，而这正是当前计算机科学和自动驾驶

发表于 12-30 09:40 •2407次阅读

FPGA在自动驾驶领域有哪些应用？

控制。在视觉算法方面，FPGA利用自身并行处理和高速存储器的特点，极大地加快了算法的执行速度，提高了运算效率。五、未来发展趋势随着自动驾驶技术的不断发展，FPGA在自动驾驶领域的应用

发表于 07-29 17:09

FPGA在自动驾驶领域有哪些优势?

FPGA（Field-Programmable Gate Array，现场可编程门阵列）在自动驾驶领域具有显著的优势，这些优势使得FPGA成为自动驾驶技术中不可或缺的一部分。以下是FPGA在自

发表于 07-29 17:11

谷歌的自动驾驶汽车是酱紫实现的吗？

看到新闻报道说谷歌自动驾驶汽车已经行驶近30万公里了，非常的强大~~上次参加了重庆新能源汽车峰会，对会上富士通半导体宣讲的一款全景视频汽车实时监控技术平台似乎看到了自动驾驶的影子（利用MB86R11

发表于 06-14 16:15

自动驾驶真的会来吗？

，这些周边的技术和系统扮演着非常重要的角色。　　“完善的自动驾驶需要海量数据，需要对每个城市道路交通情况有充分地认知过程。还需要在感应器、大数据、机器学习、计算机视觉和车联网等诸多领域进行长期且深入

发表于 07-21 09:00

自动驾驶的到来

的车载处理器仍然将是半导体厂商在汽车电子领域的重点投资及发展方向。中国自动驾驶面临的挑战　　首先中国不同地域以及城镇之间在道路基础设施方面存在差异，包括路标、车道线、红绿灯等设置各有不同。中国特色

发表于 06-08 15:25

AI/自动驾驶领域的巅峰会议—国际AI自动驾驶高峰论坛

已经渗透到了社会生活的方方面面。人工智能在自动驾驶领域将对整个汽车出行领域产生颠覆性变革。汽车的人工智能技术和数据后端的最新突破使自动驾驶成为可能。深度学习、高级数字助理和动态电子视野

发表于 09-13 13:59

无人驾驶与自动驾驶的差别性

在自动驾驶领域，目前有两大技术路径：一是以特斯拉等汽车厂商为代表的“辅助驾驶”升级路线，其探测技术基础是摄像头（机器视觉）、毫米波雷达、超声雷达；二是以谷歌等互联网公司为代表的“无人

发表于 09-28 16:50

如何让自动驾驶更加安全？

的新领域，除了要做好汽车之外，还包括通信技术、高精度地图、交通基础设施等支撑，这些因素都会影响实现完全自动驾驶目标的进程。“‘聪明’的车需要有‘聪明’的路。”交通运输部科技司副司长袁鹏认为，车、路协同

发表于 05-13 00:26

自动驾驶系统要完成哪些计算机视觉任务？

Geiger 的研究主要集中在用于自动驾驶系统的三维视觉理解、分割、重建、材质与动作估计等方面。他主导了自动驾驶领域著名数据集 KITTI 及多项自

发表于 07-30 06:49

联网安全接受度成自动驾驶的关键

随着时代的演进与汽车工业技术、机器视觉系统、人工智能和传感器相关技术上不断创新与进步，无人自动驾驶汽车已不是一件遥不可及的梦想，Google与国际车厂相继针对自动驾驶技术致力研究开发，进一步让

发表于 08-26 06:45

为什么视觉系统对自动驾驶至关重要看了就知道

为什么视觉系统对自动驾驶至关重要？

发表于 12-29 06:43

视觉系统对自动驾驶的重要性

为什么视觉系统对自动驾驶至关重要？

发表于 01-25 07:51

基于视觉的slam自动驾驶

基于视觉的slam自动驾驶，这是我们测试的视频《基于slam算法的智能机器人》调研分析报告项目背景分析机器人曾经是科幻电影中的形象，可目前已经渐渐走入我们的生活。机器人技术以包含机械、电子、自动

发表于 08-09 09:37

自动驾驶系统设计及应用的相关资料分享

作者：余贵珍、周彬、王阳、周亦威、白宇目录第一章 自动驾驶系统概述1.1 自动驾驶系统架构1.1.1 自动驾驶系统的三个层级1.1.2 自动驾驶系统的基本技术架构1.2

发表于 08-30 08:36

搜索历史

如何入门面向自动驾驶领域的视觉Transformer？

评论

机器视觉在自动驾驶中的应用

FPGA在自动驾驶领域有哪些应用？

FPGA在自动驾驶领域有哪些优势?

谷歌的自动驾驶汽车是酱紫实现的吗？

自动驾驶真的会来吗？

自动驾驶的到来

AI/自动驾驶领域的巅峰会议—国际AI自动驾驶高峰论坛

无人驾驶与自动驾驶的差别性

如何让自动驾驶更加安全？

自动驾驶系统要完成哪些计算机视觉任务？

联网安全接受度成自动驾驶的关键

为什么视觉系统对自动驾驶至关重要看了就知道

视觉系统对自动驾驶的重要性

基于视觉的slam自动驾驶

自动驾驶系统设计及应用的相关资料分享