COCO单模型测试取得新纪录：60.6 AP-电子发烧友网

随着注意力机制在自然语言处理和计算机视觉等多个人工智能领域风靡，计算机视觉领域刷榜之争可谓是进入白热化阶段。

近期大量工作刷新现有各项任务SOTA：前脚谷歌刚在图像识别ImageNet上准确度超过90，紧接着微软又在目标检测COCO上AP超过60。

在一篇CVPR 2021 论文中，来自微软的研究者提出多重注意力机制统一目标检测头方法Dynamic Head, 可插拔特性提高多种目标检测框架的性能。

在Transformer骨干和额外数据加持下，COCO单模型测试取得新纪录：60.6 AP。

方法概述

本文首先对现有目标检测头的改进工作进行了总结，发现近期方法主要通过三个不同的角度出发进行目标检测性能的提升：

尺度感知：目标尺度的差异对应了不同尺度的特征，改进不同级的表达能力可以有效提升目标检测器的尺度感知能力；

空间位置：不相似目标形状的不同几何变换对应了特征的不同空间位置，改进不同空间位置的表达能力可以有效提升目标检测器的空间位置感知能力；

多任务：目标表达与任务的多样性对应了不同通道特征，改进不同通道的表达能力可以有效提升目标检测的任务感知能力。

本文提出一种新颖的动态头框架，它采用多注意力机制将不同的目标检测头进行统一。

通过特征层次之间的注意力机制用于尺度感知，空间位置之间的注意力机制用于空间感知，输出通道内的注意力机制用于任务感知，该方法可以在不增加计算量的情况显著提升模型目标检测头的表达能力。

为了达成以上目的，本文对特征金字塔进行重构，将不同层级的特征统一到一个3D张量，并发现在不同维度引入注意力机制可以提高对尺度，空间位置和多任务的感知能力。

因此上述方向可以统一到一个高效注意力学习问题中。本文也是首个尝试采用多注意力机制将三个维度组合构建统一头并最大化其性能的工作。

作者将注意力函数转换为三个序列子注意力函数来解决传统注意力函数在高维度导致计算量激增的问题。

每个注意力函数仅聚焦一个维度：基于SE模块的尺度自注意函数π_L, 基于可变形卷积的空间自注意函数π_S 和基于动态ReLU激活函数的多任务的自注意函数π_C。

作者将三种自注意函数进行堆叠，形成一个可轻易插拔的模块DyHead，并将其应用于多种目标检测框架中。

实验结果

作者首先分析了的计算效率。当采用6个模块时，模型性能提升达到最大，而计算量提升相比骨干网络可以忽略。

作者将DyHead集成到不同检测器进行性能对比，发现所提DyHead可以一致性提升所有主流目标检测器性能：1.2~3.2AP，展示了优异的可插拔扩展性能。

在与其他目标检测方法的对比中，所提方案以较大的优势超越了流行方案。相比仅采用多尺度寻览的方法，所提方案仅需2x训练即可取得新的SOTA指标52.3AP。相对于谷歌提出的EfficientDet与SpineNet，所提方法训练时间更少(仅1/20);

当同时采用多尺度训练与测试时，所提方法取得了新的SOTA指标54.0AP，以1.3AP指标优于此前最佳。

当引入更优异的Transformer骨干网络、以及通过类似于谷歌自我学习方法生成的额外伪框的ImageNet数据后，所提方案取得了COCO新的记录：60.6 AP，成为首个超过60的单模型方法。

责任编辑：lq6

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

计算机视觉

计算机视觉

+关注

关注
8

文章
1702

浏览量
46224
自然语言处理

自然语言处理

+关注

关注
1

文章
623

浏览量
13710

原文标题：刷新记录！ CVPR2021全新目标检测机制达到SOTA！

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

为什么无法使用OpenVINO™模型优化器转换TensorFlow 2.4模型？

已下载 ssd_mobilenet_v2_fpnlite_640x640_coco17_tpu-8 型号。使用将模型转换为中间表示（IR） ssd_support_api_v.2.4.json

发表于 03-05 09:07

无法将自定义COCO数据集导入到OpenVINO™ DL Workbench怎么解决？

以精确 FP32 将自定义模型转换为中间表示（IR）格式。使用未注注的数据集和默认配置将 IR （FP32）转换为 IR （INT8）。使用 IR（INT8）推断造成糟糕的结果。创建

发表于 03-05 06:02

光纤单模双模怎么看

要区分光纤是单模还是双模(通常所说的“双模”光纤实际上是指多模光纤)，可以通过以下几种方法：一、颜色区分单模光纤：通常用黄色表示，其接头和保护套为蓝色。多模光纤：一般用橙色或灰色来表示，接头

发表于 11-14 09:56 •5191次阅读

NVIDIA文本嵌入模型NV-Embed的精度基准

NVIDIA 的最新嵌入模型 NV-Embed —— 以 69.32 的分数创下了嵌入准确率的新纪录海量文本嵌入基准测试（MTEB）涵盖 56 项嵌入任务。

发表于 08-23 16:54 •2150次阅读

NVIDIA文本嵌入<b class='flag-5'>模型</b>NV-Embed的精度基准

如何解决单模光模块使用多模光纤的问题

单模光模块和多模光模块是两种不同类型的光模块，它们在光纤通信系统中有着不同的应用场景。单模光模块和多模光模块的定义单模光模块和多模光模块都是光纤通信系统中的关键组件，它们的主要区别在于所

发表于 08-23 09:47 •1593次阅读

单模单纤与单模双纤的哪个稳定?

单模单纤与单模双纤是两种常见的光纤通信方式，它们在稳定性、传输距离、成本等方面存在一定的差异。一、单模单纤与单模双纤的基本概念 1.1 单模

发表于 08-08 17:03 •1324次阅读

单模单纤与单模双纤的优缺点是什么

单模单纤和单模双纤是光纤通信系统中的两种常见配置方式。它们在光纤通信系统中有着各自的优缺点。一、单模单纤定义单模单纤是指在光纤通信系统中，只使用一根

发表于 08-08 17:01 •2122次阅读

单模铠装光缆与室外单模光缆区别

单模铠装光缆与室外单模光缆在多个方面存在显著区别，以下是对两者区别的详细分析：一、外观与结构外观颜色：单模铠装光缆一般是黑色的，而室外单模光缆通常是黄色的。这种颜色差异有助于在实际

发表于 07-29 10:04 •722次阅读

如何不用wifi_station_scan() 取得当前已经连线AP的BSSID？

请问如何不用 wifi_station_scan() 取得当前已经连线 AP 的 BSSID？使用 wifi_station_scan() 会造成当前连线出现断线等问题，是否有其他不影响连线的取得方式？

发表于 07-12 15:25

如何使用AP525测试泰凌硬件的音频指标（二）— AP525测试平台介绍

本章节将以AP525为例，介绍仪器硬件接口及AP测试软件界面及常规的序列测试操作流程，熟悉本章节后将以泰凌TLSR9518A EVB作为DUT测试

发表于 06-26 09:32 •1091次阅读

ESP8266 STA+AP模式下丢包如何解决？

AT命令模式下ESP8266 STA+AP模式下，发送数据（at命令发送上位机发送modbus命令询问13个寄存器每秒发送一次，ESP8266做出回应），经过测试发送成功率在95%；但如果在

发表于 06-26 06:25

单模光纤的衰减特性是什么水平

单模光纤是一种光传输介质，具有较低的衰减特性。在本文中，我们将详细讨论单模光纤的衰减水平、原因以及如何减少衰减。一、单模光纤衰减特性概述单模光纤衰减指的是光信号传输过程中由于各种原

发表于 04-09 17:08 •1057次阅读

多模光纤和单模光纤能混用吗为什么

多模光纤和单模光纤能混用。光纤通信的快速发展背后离不开多模光纤和单模光纤的卓越性能。多模光纤通常用于短距离通信，而单模光纤则适合长距离传输。本文将着重讨论多模光纤与单模光纤的混合使用的

发表于 04-07 17:08 •5883次阅读

什么是单模光纤和多模光纤的区别

单模光纤和多模光纤是光纤通信中常用的两种光纤类型。它们在构造、传输特性和应用领域上都有所不同。下面将详细介绍单模光纤和多模光纤的区别。首先，单模光纤和多模光纤的构造有所不同。单模光纤

发表于 04-07 17:05 •1214次阅读

单模光纤能用多模光模块吗为什么

单模光纤和多模光纤是两种不同的光纤传输方式。单模光纤通常用于长距离传输和高速传输，而多模光纤则主要用于短距离传输。由于它们之间存在一些差异，因此不能直接使用多模光模块进行单模光纤的传输。首先，

发表于 04-03 16:50 •3806次阅读

搜索历史

COCO单模型测试取得新纪录：60.6 AP

评论

为什么无法使用OpenVINO™模型优化器转换TensorFlow 2.4模型？

无法将自定义COCO数据集导入到OpenVINO™ DL Workbench怎么解决？

光纤单模双模怎么看

NVIDIA文本嵌入模型NV-Embed的精度基准

如何解决单模光模块使用多模光纤的问题

单模单纤与单模双纤的哪个稳定?

单模单纤与单模双纤的优缺点是什么

单模铠装光缆与室外单模光缆区别

如何不用wifi_station_scan() 取得当前已经连线AP的BSSID？

如何使用AP525测试泰凌硬件的音频指标（二）— AP525测试平台介绍

ESP8266 STA+AP模式下丢包如何解决？

单模光纤的衰减特性是什么水平

多模光纤和单模光纤能混用吗为什么

什么是单模光纤和多模光纤的区别

单模光纤能用多模光模块吗为什么