数据高效缺陷检测技术有哪些-电子发烧友网

1. 摘要

CVPR VISION 23挑战赛第1赛道 "数据智能缺陷检测 "要求参赛者在数据缺乏的环境下对14个工业检测数据集进行实例分割。本论文的方法聚焦于在有限训练样本的场景下提高缺陷掩模的分割质量的关键问题。基于混合任务级联(HTC)实例分割算法，我们用受CBNetv2启发的复合连接将transformer骨干(Swin-B)连接起来以增强基准结果。此外，我们提出了两种模型集成方法来进一步增强分割效果:一种是将语义分割整合到实例分割中，另一种是采用多实例分割融合算法。最后，通过多尺度训练和测试时数据增强(TTA)，我们在数据高效缺陷检测挑战赛的测试集上获得了高于48.49%的平均mAP@0.50:0.95和66.71%的平均mAR@0.50:0.95。论文链接：https://arxiv.org/abs/2306.14116代码链接：https://github.com/love6tao/

2. 背景补充

深度学习在视觉检测中的应用越来越广泛，这包括如无人机巡检电力设备、检测工业表面上的轻微划痕、识别深孔零件中的铜线缺陷以及检测芯片和玻璃表面上的导电微粒等工业缺陷检测任务。但是，在工业制造场景中获得标注的缺陷数据是困难、昂贵和耗时的，因此使得基于视觉的工业检测更具挑战性。为了解决这个问题，CVPR VISION 23挑战赛第1赛道 - 数据高效缺陷检测竞赛启动。

该竞赛数据集由14个来自真实场景的缺陷数据集组成，最显著的特点是测试样本数量远远超过训练样本数量。如上图所示，一些数据集如电容器和电子设备数据集仅包含不超过40个训练样本。此外，某些图像在数据集中存在显著的尺度变化。大多数框只覆盖图像的10%，而一些框可以覆盖整个图像。而且，14个数据集之间的背景和缺陷纹理形状存在显著差异，使得构建可以在每个数据集上都取得满意结果的统一算法框架是一个巨大的挑战。为了解决这些问题，我们训练了一个以Swin Transformer 和CBNetV2 为骨干的强大基准模型，然后采用两种模型集成方法来进一步提升分割性能。我们将在第2节中介绍我们的流程和详细组件。实验结果和消融研究显示在第3节中。

3. 方法介绍

在这一节中，我们提出了一个由三部分组成的有效流程。首先训练一个强大的单实例分割模型作为基准，使用混合任务级联，以Swin Transformer和CBNetV2作为其骨干，如上图所示。其次，使用Mask2Former 训练一个强大的语义分割模型来进一步提炼分割性能，将语义分割结果与实例分割结果融合。最后，融合三个实例分割模型的结果以进一步改进分割效果用于最终提交。

3.1 基础实例分割模型

我们的基础实例分割模型建立在混合任务级联(HTC) 检测器之上，使用CBSwinBase骨干和CBFPN 架构。HTC是一个用于实例分割任务的稳健的级联架构，它巧妙地混合了检测和分割分支进行联合多阶段处理，在每个阶段逐步提取更有区分性的特征。为避免需要额外的语义分割注释，我们从解决方案中删除了语义头部。最近的视觉Transformer的进步对各种视觉任务非常重要，因此我们采用Swin Transformer作为我们的骨干。Swin Transformer在分层特征架构中引入了一个高效的window注意力模块，其计算复杂度与输入图像大小呈线性关系。在我们的工作中，我们采用在ImageNet-22k数据集上预训练的Swin-B网络作为我们的基本骨干。为进一步提高性能，我们受CBNetv2算法的启发，通过复合连接将两个相同的Swin-B网络组合在一起。如上图所示。

3.2 将语义分割整合到实例分割中

尽管单个模型可以取得很好的分割结果，但实例分割的结果通常不完整，特别是在设定IOU阈值过高时，这可能对mask mAP 产生负面影响。因此，我们使用语义分割模型的输出来补充实例分割模型的结果。

我们的语义分割模型基于Mask2Former，使用Swin-L作为骨干，其网络输入图像大小为512×512。预训练权重来自ADE20K数据集。为了训练语义分割网络，我们将多缺陷标签转换为表示背景和缺陷的二进制标签。

对于融合策略，我们在相同的像素位置组合实例分割结果和语义分割结果，生成新的实例分割结果，如上图所示。由于语义分割任务将像素划分为两类:缺陷和背景，所以实例分割任务中的预测边界框(bbox)类确定了像素的实际类。值得注意的是，只有预测实例与bbox置信度大于阈值才会与语义分割结果进行融合。在竞赛中，我们将设置为0.5以获得最佳的分割性能。

3.3 多个实例分割的融合

我们的实验结果表明，不同的实例分割骨干可以产生互补的结果。这意味着融合不同骨干的实例分割结果可以提高模型的召回率。但是，提高召回率往往以牺牲检测精度为代价。为解决这个问题，我们设计了一个融合策略，如上图所示。

在我们的实验中，我们将model-1、model-2和model-3分别称为HTC、Cascade Mask rcnn-ResNet50和Cascade Mask rcnn-ConvNext模型。这些模型的设计目的是在它们之间增加多样性。

Mask2Former是一个经过验证的高效语义分割架构，已经被证明在各种应用中都能实现最先进的结果，如语义、实例和全景分割。通过将语义分割与实例分割相结合，我们在测试数据集上取得了显着的48.38%的mask mAP。最后，通过平均模型包中这些模型的预测，我们的模型集成在竞赛中实现了卓越的性能，mAP达到48.49%，mAR达到66.71%。

4. 未来改进方向

半监督学习:在我们的实验中，我们仅关注在训练和验证集上训练实例分割模型。我们尝试使用基于soft-te acher的半监督学习方法来改进实例分割的性能。然而，由于数据集的差异，无法为半监督模型提供统一的训练策略。由于竞赛时间的限制，以后的研究将半监督方法作为一个更可行的方向。

SAM: Meta提出了通用分割模型(SAM)作为解决分割任务的基础模型。我们通过在线演示网站评估了其有效性，并确定该模型在工业数据上的泛化性能也很出色。但是，根据竞赛规则，我们不能使用SAM。尽管如此，大模型或基础模型仍有可能为工业缺陷检测带来重大变化，从而为未来工作提供了另一个改进方向。

5. 结论

在论文中，我们介绍了CVPR VISION 23挑战赛第1赛道亚军解决方案"数据高效缺陷检测"技术细节。作者的方法包括三个主要组成部分:基础实例分割模型、将语义分割整合到实例分割中的方法以及融合多个实例分割的策略。通过一系列实验，我们证明了我们的方法在测试集上的竞争力，在mAP@0.50:0.95上获得48.49%以上，在mAR@0.50:0.95上获得66.71%以上。

责任编辑：彭菁

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据

数据

+关注

关注
8

文章
6867

浏览量
88800
检测技术

检测技术

+关注

关注
2

文章
352

浏览量
29062
分割

分割

+关注

关注
0

文章
17

浏览量
11892

原文标题：CVPR VISION 23挑战赛第1赛道亚军解决方案 - 数据高效缺陷检测

文章出处：【微信号：GiantPandaCV，微信公众号：GiantPandaCV】欢迎添加关注！文章转载请注明出处。

基于AI深度学习的缺陷检测系统

在工业生产中，缺陷检测是确保产品质量的关键环节。传统的人工检测方法不仅效率低下，且易受人为因素影响，导致误检和漏检问题频发。随着人工智能技术的飞速发展，特别是深度学习

发表于 07-08 10:30 •1131次阅读

外观缺陷检测原理

的结合应用加速渗透进工业产品的外观缺陷检测领域。思普泰克凭借深耕机器视觉多年沉淀的技术实力，建立以深度学习技术为核心的差异化发展优势，开发出视觉引擎等工业级视觉应用产品，全面赋能产

发表于 06-17 17:38 •370次阅读

外观<b class='flag-5'>缺陷</b><b class='flag-5'>检测</b>原理

产品标签OCR识别缺陷检测系统方案

目前实验来看，康耐德机器视觉可以检测出标签有无以及有没贴歪斜，印刷字符只能检测出缺陷比较大的产品，具体还要以实际缺陷产品来模拟确认。此方案适合65mm以下产品，由于颜色太多，不能所有产

发表于 06-10 18:26 •674次阅读

产品标签OCR识别<b class='flag-5'>缺陷</b><b class='flag-5'>检测</b>系统方案

磁粉检测的特点及应用有哪些?

磁粉检测（Magnetic Particle Inspection，简称MPI）是一种非破坏性检测方法，主要用于检测铁磁性材料表面的缺陷。它通过在被

发表于 05-24 15:23 •1393次阅读

想要高效检测O型圈外观缺陷？必看攻略！

等外观缺陷。检测速度每分钟60/min 为解决客户产品测量编程量大、效率低等问题，思普泰克提供了高效、简洁的 O型圈外观缺陷检测解决方案。

发表于 05-16 17:19 •555次阅读

蔡司工业ct内部瑕疵缺陷检测机

蔡司工业ct内部瑕疵缺陷检测机是一种基于计算机断层扫描（CT）技术的检测方法，其核心原理是利用X射线的穿透能力来检测物体内部的瑕疵和

发表于 04-17 16:21 •360次阅读

如何应对工业缺陷检测数据短缺问题？

这篇论文介绍了一种文本引导的变分图像生成方法，旨在解决工业制造中的异常检测和分割问题。传统方法通过训练非缺陷数据的分布来进行异常检测，但这需要大量且多样化的非

发表于 03-14 10:15 •388次阅读

洞察缺陷：精准检测的关键

缺陷检测是生产过程的重要组成部分。它有助于确保产品的高质量和满足客户的需求。缺陷检测有许多不同的解决方案，特定应用的最佳解决方案取决于所

发表于 02-26 15:44 •311次阅读

基于深度学习的芯片缺陷检测梳理分析

虽然表面缺陷检测技术已经不断从学术研究走向成熟的工业应用，但是依然有一些需要解决的问题。基于以上分析可以发现，由于芯片表面缺陷的独特性质，通

发表于 02-25 14:30 •1260次阅读

机器视觉缺陷检测是工业自动化领域的一项关键技术

机器视觉缺陷检测是工业自动化领域的一项关键技术，

发表于 02-22 13:59 •490次阅读

无纺布缺陷在线检测仪怎么用

监测。那么，无纺布缺陷在线检测仪到底怎么用呢?它的检测效果又如何呢?本文将为您详细解答。一、无纺布缺陷在线检测仪的基本原理无纺布

发表于 02-03 14:58 •463次阅读

描绘未知：数据缺乏场景的缺陷检测方案

Neuro-T 视觉平台克服了数据缺乏状况的困难，通过零代码设置 GAN模型和无监督学习模型，轻松实现缺陷图像的标注、绘制和导出。工业应用中存在较多的缺陷检测需求。针对

发表于 01-25 10:46 •500次阅读

机器视觉之玻璃产品缺陷检测

基于机器视觉技术的玻璃质量检测流程：产品经过光学系统，LED红光垂直（或其他角度）入射待检测玻璃后，若玻璃中存在缺陷，CCD相机的靶面检测到

发表于 12-22 16:09 •781次阅读

电子元件缺陷检测方法

电子元件是现代科技中不可或缺的一部分，但由于制造过程中的复杂性，元件可能出现各种缺陷。为了保证电子元件的质量和可靠性，缺陷检测是必不可少的过程。本文将详细介绍电子元件缺陷

发表于 12-18 14:46 •1225次阅读

柔性印刷线路板缺陷检测方法指南

现有的FPC缺陷检测算法多衍生于PCB检测算法，但受本身独特性限制，FPC板缺陷要求更高，检测样板尺寸更大，样板成像易变形，使得针对PCB板

发表于 11-30 15:29 •487次阅读