0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

YOLOv6 v3.0实时目标检测重磅升级

CVer 来源:AIWalker 2023-01-30 17:09 次阅读

6e731eee-9654-11ed-bfe3-dac502259ad0.png

YOLOv6 v3.0的主要贡献简述如下:

检测器的Neck部件进行了翻新:引入BiC(Bi-directional Concatenation)提供更精确的定位信息将SPPF简化为SimCSPSPPF,牺牲较少的速度提升更多的性能

提出一种AAT(Anchor-aided training)策略,在不影响推理效率的情况下同时受益于Anchor-basedAnchor-free设计理念。

对YOLOv6的Backbone与Neck进行加深,在更高分辨率输入下达成新的SOTA性能。

提出一种新的自蒸馏策略提升YOLOv6小模型的性能,训练阶段采用更大的DFL作为增强版辅助回归分支。

本文方案

6e9a561c-9654-11ed-bfe3-dac502259ad0.png

Network Design

网络架构方面,本文主要从Neck与SPP两个维度进行改进:

在Neck方面,本文设计了一种增强的PAN模块,它次用BiC模块对三个近邻层特征进行集成(可参考上图b),额外引入了pYYBAGPXic-AAB3gAAAFpuLanWI164.jpg。这种处理截止可以保留更精确的定位信息,对于小目标定位非常重要。

在SPP方面,本文对YOLOv5 v6.1版本的SPPF进行了简化,得到了所谓的SimCSPSPPF(可参考上图c)。

Anchor-Aided Training

6ea87242-9654-11ed-bfe3-dac502259ad0.png

YOLOv6是一种追求更高推理速度的Anchor-free检测器。然而,作者发现:在同等配置(YOLOv6-N)下,相比Anchor-free方案,Anchor-based方案可以带来额外的性能增益,见上表。

6eb9c15a-9654-11ed-bfe3-dac502259ad0.png

有鉴于此,作者提出了AAT策略(即Anchor辅助训练,见上图),它引入了一个Anchor-based辅助分支以组合两种方案的优势。通过这种训练策略,源自的辅助分支的引导信息可以被有效的嵌入到Anchor-free分支。在推理阶段,辅助分支将被移除掉。也就是说,AAT策略属于"赠品",加量不加价的那种

Self-distillation

在YOLOv6早期版本中,自蒸馏仅在大模型中得到应用,采用的普通KL散度蒸馏。知识蒸馏损失与整体损失定义如下:超参数用于对两个损失进行平衡。在训练的早期,源自老师模型的软标签更易于学习;而在训练的后期,学生模型从硬标签中受益更多。

因此,作者设计了一种cosine weight decay调整机制:由于DFL会对回归分支引入额外的参数,极大程度影响小模型的推理速度。因此,作者针对小模型设计了一种DLD(Decoupled Localization Distillation)以提升性能且不影响推理速度。具体来说,在小模型中插入一个增强版回归分支作为辅助。在自蒸馏阶段,小模型受普通回归分支与增强回归分支加持,老师模型近使用辅助分支。

需要注意:普通分支仅采用硬标签进行训练,而辅助分支则用硬标签与源自老师模型的软标签进行训练。完成蒸馏后,仅普通分支保留,辅助分支被移除。这种训练策略又是一种加量不加价的"赠品"。

Experiments

6ecdec7a-9654-11ed-bfe3-dac502259ad0.png

上表给出了不同方案的性能对比,可以看到:

相比YOLOv5-N、YOLOv7-Tiny,YOLOv6-N指标分别提升9.5%、4.2%,同时具有最佳速度。

相比YOLOX-S、PPYOLOE-S、YOLOv6-S指标分别提升3.5%、0.9%且速度更快;

YOLOv6-M比YOLOv5-M指标高4.6%、速度相当,比YOLOX-M、PPYOLOE-M指标高3.1%、1.0%且速度更快;

除了比YOLOv5-L更高更快外,YOLOv6-L比YOLOX-L、PPYOLOE-L分别高3.1%、1.4%且速度相当。

相比YOLOv8,YOLOv6在所有尺寸下取得了相当的精度,同时具有更优的吞吐性能。

除了上述常规模型尺寸外,作者还进一步提升了输入分辨率并添加了C6特征,与YOLOv5等方案对比:

相比YOLOv5系列(即YOLOv5-N6/S6/M6/L6/X6),YOLOv6具有更高的AP、相当的速度;

相比YOLOv7-E6E,YOLOv6-L6指标高出0.4%,推理速度快36%。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 检测器
    +关注

    关注

    1

    文章

    860

    浏览量

    47651

原文标题:超越YOLOv8!YOLOv6 v3.0实时目标检测重磅升级!

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    YOLOV7网络架构解读

    继美团发布YOLOV6之后,YOLO系列原作者也发布了YOLOV7。
    的头像 发表于 11-29 10:00 1773次阅读
    <b class='flag-5'>YOLOV</b>7网络架构解读

    电脑店U盘启动盘制作工具V3.0(智能装机版)

    : FBCFF103B69C2755CE0299EC4A6C608ASHA1: 92514FE9AFA23FB9E2FB1B04E9888B17D9A4B464CRC32: 687F586E电脑店U盘启动盘制作工具 V3.0(智能装机版)更新:1、更新免格式化
    发表于 10-20 13:33

    MCUBootUtility v3.0怎么样?

    MCUBootUtility v3.0怎么样?
    发表于 02-10 06:07

    YOLOv6中的用Channel-wise Distillation进行的量化感知训练

    1、YOLOv6中的用Channel-wise Distillation进行的量化感知训练来自哪里  知识蒸馏 (KD)已被证明是一种用于训练紧凑密集预测模型的简单有效的工具。轻量级学生网络通过
    发表于 10-09 16:25

    茂名信息网 v3.0

    v3.0正式版升级说明: 1、重新改版整个网站的美工以及排版 2、调整了全站代码,连带所有的无效符号全部清理干净 本版本没有任何功能限制,但只能在本地使用127.0.0.1测
    发表于 03-08 22:01 29次下载

    海尔25T6D-TD(8823 V3.0)存储器数据

    海尔25T6D-TD(8823 V3.0)存储器数据
    发表于 06-01 09:58 36次下载

    FilterPro v3.0设计工具的最新版本

    FilterPro v3.0设计工具的最新版本 TI推出其普及型 FilterProTM 设计工具的最新版本。该 FilterPro v3.0 更新了各种功能,如调节无源元件容差、查看
    发表于 05-17 13:36 8165次阅读

    STM32F103ZET6 V3.0核心板电路图

    STM32F103ZET6 V3.0核心板电路图。
    发表于 10-29 17:00 59次下载

    EP1122集合版V3.0

    液晶烧录EP1122集合版V3.0用于烧录驱动板
    发表于 11-30 15:56 0次下载

    STM32F4 EMWIN开发手册V3.0

    STM32F4 EMWIN开发手册V3.0 STM32F4 EMWIN开发手册V3.0
    发表于 07-25 17:45 40次下载

    VORX-NH 说明书V3.0

    VORX-NH 说明书V3.0
    发表于 12-30 14:50 0次下载

    NodeMCU V3.0 Arduino开发之点灯

    NodeMCU V3.0 Arduino开发之点灯测试程序手头到了一个NodeMCU v3.0,3.0版本和2.0差别不大,只是v2.0串口芯片是CP2101,而v3.0是CH340,
    发表于 10-25 18:21 14次下载
    NodeMCU <b class='flag-5'>V3.0</b> Arduino开发之点灯

    YOLOv6在LabVIEW中的推理部署(含源码)

    YOLOv6 是美团视觉智能部研发的一款目标检测框架,致力于工业应用。如何使用python进行该模型的部署,官网已经介绍的很清楚了,但是对于如何在LabVIEW中实现该模型的部署,笔者目前还没有看到
    的头像 发表于 11-06 16:07 171次阅读
    <b class='flag-5'>YOLOv6</b>在LabVIEW中的推理部署(含源码)

    YOLOv6模型文件的输入与输出结构

      YOLOv6人脸检测模型 YOLOv6上次(应该是很久以前)发布了一个0.3.1版本,支持人脸检测与五点landmark调用,后来我就下载,想使用一下,发现居然没有文档,也没有例子
    的头像 发表于 06-25 15:37 906次阅读
    <b class='flag-5'>YOLOv6</b>模型文件的输入与输出结构

    YOLOv8+OpenCV实现DM码定位检测与解析

    YOLOv8是YOLO系列模型的最新王者,各种指标全面超越现有对象检测与实例分割模型,借鉴了YOLOv5、YOLOv6、YOLOX等模型的设计优点,全面提升改进
    的头像 发表于 08-10 11:35 1239次阅读
    <b class='flag-5'>YOLOv</b>8+OpenCV实现DM码定位<b class='flag-5'>检测</b>与解析