0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据高效缺陷检测技术有哪些

jf_pmFSk4VX 来源:GiantPandaCV 2023-07-18 15:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1. 摘要

CVPR VISION 23挑战赛第1赛道 "数据智能缺陷检测 "要求参赛者在数据缺乏的环境下对14个工业检测数据集进行实例分割。本论文的方法聚焦于在有限训练样本的场景下提高缺陷掩模的分割质量的关键问题。基于混合任务级联(HTC)实例分割算法,我们用受CBNetv2启发的复合连接将transformer骨干(Swin-B)连接起来以增强基准结果。此外,我们提出了两种模型集成方法来进一步增强分割效果:一种是将语义分割整合到实例分割中,另一种是采用多实例分割融合算法。最后,通过多尺度训练和测试时数据增强(TTA),我们在数据高效缺陷检测挑战赛的测试集上获得了高于48.49%的平均mAP@0.50:0.95和66.71%的平均mAR@0.50:0.95。论文链接:https://arxiv.org/abs/2306.14116代码链接:https://github.com/love6tao/

2. 背景补充

深度学习在视觉检测中的应用越来越广泛,这包括如无人机巡检电力设备、检测工业表面上的轻微划痕、识别深孔零件中的铜线缺陷以及检测芯片和玻璃表面上的导电微粒等工业缺陷检测任务。但是,在工业制造场景中获得标注的缺陷数据是困难、昂贵和耗时的,因此使得基于视觉的工业检测更具挑战性。为了解决这个问题,CVPR VISION 23挑战赛第1赛道 - 数据高效缺陷检测竞赛启动。

071307fa-24b1-11ee-962d-dac502259ad0.png

该竞赛数据集由14个来自真实场景的缺陷数据集组成,最显著的特点是测试样本数量远远超过训练样本数量。如上图所示,一些数据集如电容器和电子设备数据集仅包含不超过40个训练样本。此外,某些图像在数据集中存在显著的尺度变化。大多数框只覆盖图像的10%,而一些框可以覆盖整个图像。而且,14个数据集之间的背景和缺陷纹理形状存在显著差异,使得构建可以在每个数据集上都取得满意结果的统一算法框架是一个巨大的挑战。为了解决这些问题,我们训练了一个以Swin Transformer 和CBNetV2 为骨干的强大基准模型,然后采用两种模型集成方法来进一步提升分割性能。我们将在第2节中介绍我们的流程和详细组件。实验结果和消融研究显示在第3节中。

3. 方法介绍

0741b9a6-24b1-11ee-962d-dac502259ad0.png

在这一节中,我们提出了一个由三部分组成的有效流程。首先训练一个强大的单实例分割模型作为基准,使用混合任务级联,以Swin Transformer和CBNetV2作为其骨干,如上图所示。其次,使用Mask2Former 训练一个强大的语义分割模型来进一步提炼分割性能,将语义分割结果与实例分割结果融合。最后,融合三个实例分割模型的结果以进一步改进分割效果用于最终提交。

3.1 基础实例分割模型

075b50fa-24b1-11ee-962d-dac502259ad0.png

我们的基础实例分割模型建立在混合任务级联(HTC) 检测器之上,使用CBSwinBase骨干和CBFPN 架构。HTC是一个用于实例分割任务的稳健的级联架构,它巧妙地混合了检测和分割分支进行联合多阶段处理,在每个阶段逐步提取更有区分性的特征。为避免需要额外的语义分割注释,我们从解决方案中删除了语义头部。最近的视觉Transformer的进步对各种视觉任务非常重要,因此我们采用Swin Transformer作为我们的骨干。Swin Transformer在分层特征架构中引入了一个高效的window注意力模块,其计算复杂度与输入图像大小呈线性关系。在我们的工作中,我们采用在ImageNet-22k数据集上预训练的Swin-B网络作为我们的基本骨干。为进一步提高性能,我们受CBNetv2算法的启发,通过复合连接将两个相同的Swin-B网络组合在一起。如上图所示。

3.2 将语义分割整合到实例分割中

尽管单个模型可以取得很好的分割结果,但实例分割的结果通常不完整,特别是在设定IOU阈值过高时,这可能对mask mAP 产生负面影响。因此,我们使用语义分割模型的输出来补充实例分割模型的结果。

我们的语义分割模型基于Mask2Former,使用Swin-L作为骨干,其网络输入图像大小为512×512。预训练权重来自ADE20K数据集。为了训练语义分割网络,我们将多缺陷标签转换为表示背景和缺陷的二进制标签。

078a03c8-24b1-11ee-962d-dac502259ad0.png

对于融合策略,我们在相同的像素位置组合实例分割结果和语义分割结果,生成新的实例分割结果,如上图所示。由于语义分割任务将像素划分为两类:缺陷和背景,所以实例分割任务中的预测边界框(bbox)类确定了像素的实际类。值得注意的是,只有预测实例与bbox置信度大于阈值才会与语义分割结果进行融合。在竞赛中,我们将设置为0.5以获得最佳的分割性能。

3.3 多个实例分割的融合

07a38078-24b1-11ee-962d-dac502259ad0.png

我们的实验结果表明,不同的实例分割骨干可以产生互补的结果。这意味着融合不同骨干的实例分割结果可以提高模型的召回率。但是,提高召回率往往以牺牲检测精度为代价。为解决这个问题,我们设计了一个融合策略,如上图所示。

在我们的实验中,我们将model-1、model-2和model-3分别称为HTC、Cascade Mask rcnn-ResNet50和Cascade Mask rcnn-ConvNext模型。这些模型的设计目的是在它们之间增加多样性。

Mask2Former是一个经过验证的高效语义分割架构,已经被证明在各种应用中都能实现最先进的结果,如语义、实例和全景分割。通过将语义分割与实例分割相结合,我们在测试数据集上取得了显着的48.38%的mask mAP。最后,通过平均模型包中这些模型的预测,我们的模型集成在竞赛中实现了卓越的性能,mAP达到48.49%,mAR达到66.71%。

4. 未来改进方向

半监督学习:在我们的实验中,我们仅关注在训练和验证集上训练实例分割模型。我们尝试使用基于soft-teacher的半监督学习方法来改进实例分割的性能。然而,由于数据集的差异,无法为半监督模型提供统一的训练策略。由于竞赛时间的限制,以后的研究将半监督方法作为一个更可行的方向。

SAM: Meta提出了通用分割模型(SAM)作为解决分割任务的基础模型。我们通过在线演示网站评估了其有效性,并确定该模型在工业数据上的泛化性能也很出色。但是,根据竞赛规则,我们不能使用SAM。尽管如此,大模型或基础模型仍有可能为工业缺陷检测带来重大变化,从而为未来工作提供了另一个改进方向。

5. 结论

在论文中,我们介绍了CVPR VISION 23挑战赛第1赛道亚军解决方案"数据高效缺陷检测"技术细节。作者的方法包括三个主要组成部分:基础实例分割模型、将语义分割整合到实例分割中的方法以及融合多个实例分割的策略。通过一系列实验,我们证明了我们的方法在测试集上的竞争力,在mAP@0.50:0.95上获得48.49%以上,在mAR@0.50:0.95上获得66.71%以上。

责任编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7348

    浏览量

    95014
  • 检测技术
    +关注

    关注

    2

    文章

    367

    浏览量

    30009
  • 分割
    +关注

    关注

    0

    文章

    17

    浏览量

    12147

原文标题:CVPR VISION 23挑战赛第1赛道亚军解决方案 - 数据高效缺陷检测

文章出处:【微信号:GiantPandaCV,微信公众号:GiantPandaCV】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    SEMVision™ G9:引领高产能缺陷检测新时代

    SE MVision™ G9: 引领高产能缺陷检测新时代   SEMVision G9 面向逻辑、存储器及其他器件的缺陷检测应用,通过更可靠的成像质量以及集成式人工智能
    的头像 发表于 04-07 19:02 2501次阅读
    SEMVision™ G9:引领高产能<b class='flag-5'>缺陷</b><b class='flag-5'>检测</b>新时代

    功率放大器在空气耦合超声波斜入射的钢板缺陷检测中的应用

    实验名称: 基于空气耦合超声波斜入射的钢板缺陷检测实验 研究方向: 空气耦合超声波技术在金属构件无损检测中的应用 实验目的: 通过实验解决钢质管道超声波
    的头像 发表于 03-11 18:00 1082次阅读
    功率放大器在空气耦合超声波斜入射的钢板<b class='flag-5'>缺陷</b><b class='flag-5'>检测</b>中的应用

    AOI光学检测设备原理:自动光学检测如何识别外观缺陷

    AOI 作为产线 “智能之眼”,核心通过精密光学成像获取图像,结合传统模板比对(与黄金样板比对)和深度学习(学习缺陷特征)两种算法判断 PCB 缺陷。其挑战的是 “判准” 而非 “看见”,当前正朝着混合检测、3D AOI 普及、
    的头像 发表于 02-11 10:24 774次阅读

    高压功率放大器在铝板内部缺陷脉冲涡流检测中的应用

    我国国防科技大学对脉冲涡流检测技术进行了深入的研究,广泛地将脉冲涡流检测技术应用于金属表面和亚表面缺陷尺寸的评估中,并且能够准确识别出同时存
    的头像 发表于 12-30 17:13 641次阅读
    高压功率放大器在铝板内部<b class='flag-5'>缺陷</b>脉冲涡流<b class='flag-5'>检测</b>中的应用

    光电检测赋能智能制造 - 在线检测与自动化解决方案

    巨哥科技致力于新型光电检测技术的开发,提供温度场、成分、厚度、缺陷、质量等多种检测方法,将快速、高效、在线的
    的头像 发表于 12-30 10:15 402次阅读
    光电<b class='flag-5'>检测</b>赋能智能制造 - 在线<b class='flag-5'>检测</b>与自动化解决方案

    挑花眼了吧?缺陷检测不用愁,一秒教你选对型!

    分钟找到适配自己问题的产品! 缺陷检测的每款产品,都对应着特定的行业痛点,旨在通过技术创新,将 “检测难题” 转化为 “生产优势”。从自己的痛点出发,就能选准型号,快速实现价值落地。
    的头像 发表于 11-28 16:16 687次阅读
    挑花眼了吧?<b class='flag-5'>缺陷</b><b class='flag-5'>检测</b>不用愁,一秒教你选对型!

    机器视觉缺陷检测中传感器集成的五大关键

    质量控制是制造流程中至关重要但往往效率低下的环节。机器视觉能够自动化部分或全部缺陷检测任务,但仅靠技术本身无法带来显著改进。必须理解并优化整个机器视觉检测流程,这项
    的头像 发表于 11-03 11:40 938次阅读
    机器视觉<b class='flag-5'>缺陷</b><b class='flag-5'>检测</b>中传感器集成的五大关键

    深入解析Xray无损检测核心技术与应用优势

    在现代制造业和工业检测领域,质量控制和安全保障成为首要任务。许多企业面临产品缺陷难以发现、检测成本高以及检测效率低的问题。随着技术的不断进步
    的头像 发表于 10-30 11:45 736次阅读

    机器视觉检测PIN针

    高效检测需求的优选技术路径。 项目需求 解决方案 用相机采集图片,预处理,利用Blob分析识别定,高分辨率工业相机:精确捕捉Pin针细节。定制化光学系统:采用环形光源、同轴光或条形光源组合,优化打光
    发表于 09-26 15:09

    射频功率放大器在单缺陷导波高精度检测中的关键作用

    实验名称: 单缺陷导波检测实验 研究方向: 管道运输在当今国民经济和工业运输领域有着不可或缺的作用,其有着经济、高效且安全的优势。然而管道在服役过程中并不是一劳永逸的,随着时间的推移或者存在加工
    的头像 发表于 09-24 16:15 901次阅读
    射频功率放大器在单<b class='flag-5'>缺陷</b>导波高精度<b class='flag-5'>检测</b>中的关键作用

    探秘晶圆宏观缺陷检测技术升级与根源追踪新突破

    在晶圆加工流程中,早期检测宏观缺陷是提升良率与推动工艺改进的核心环节,这一需求正驱动检测技术与晶圆测试图分析领域的创新。宏观缺陷早期
    的头像 发表于 08-19 13:48 1579次阅读
    探秘晶圆宏观<b class='flag-5'>缺陷</b>:<b class='flag-5'>检测</b><b class='flag-5'>技术</b>升级与根源追踪新突破

    塑料注塑缺陷检测的创新解决方案

    在塑料成型领域,注塑制品的质量控制至关重要。然而,塑料注塑过程中出现的缺陷不仅影响产品的外观,还可能降低其功能性能。这些缺陷的产生原因复杂多样,传统的检测方法往往难以应对复杂多变的检测
    的头像 发表于 08-05 17:52 1018次阅读
    塑料注塑<b class='flag-5'>缺陷</b><b class='flag-5'>检测</b>的创新解决方案

    饮料液位及瓶盖缺陷检测视觉系统

    在合适的光源条件下,连接了多个相机的POC系列能够成功检测到随机故意放置在产线上的有缺陷的瓶装饮料(这些缺陷包括:液位过高或过低,瓶盖未正确拧紧,标签打印错误和瓶中液体杂质/沉淀物)
    的头像 发表于 07-09 14:28 774次阅读
    饮料液位及瓶盖<b class='flag-5'>缺陷</b><b class='flag-5'>检测</b>视觉系统

    安泰ATA-2000系列高压放大器:精准助力无损检测高效发展

    超声无损检测是一种常用的材料及构件内部缺陷检测技术。它利用超声波在材料中传播的特性,通过接收回波信号来检测材料内部的
    的头像 发表于 06-07 16:09 700次阅读
    安泰ATA-2000系列高压放大器:精准助力无损<b class='flag-5'>检测</b>的<b class='flag-5'>高效</b>发展

    堆焊过程熔池相机实时缺陷检测技术

    在现代工业制造中,堆焊技术广泛应用于机械、能源、化工、航空航天等领域,用于修复磨损部件或增强工件表面性能。然而,传统堆焊过程的质量控制主要依赖人工经验或焊后检测,难以实现实时监控,导致缺陷发现滞后
    的头像 发表于 05-15 17:34 921次阅读
    堆焊过程熔池相机实时<b class='flag-5'>缺陷</b><b class='flag-5'>检测</b><b class='flag-5'>技术</b>