如何解决工业缺陷检测小样本问题-电子发烧友网

在工业生产制造中，由于生产过程是一个多因素耦合的复杂过程，生产过程中的任何异常都会导致产品缺陷产生，及时识别异常产品的缺陷模式是提高生产质量和生产效率的有效途径，所以缺陷检测具有十分重要的研究意义。

早期的产品缺陷模式识别主要是通过机器学习方法进行的，如支持向量机、反向传播网络等。这些方法与用肉眼直接对产品缺陷进行识别相比，大大降低了工作量。但是这些早期方法存在以下不足：识别准确率低且需要大量的标签数据对模型进行训练。近年来随着深度学习的发展，大量基于卷积神经网络的算法在视觉任务中大放异彩。由于卷积神经网络具有非常强大的特征提取能力，卷积神经网络在缺陷检测任务中得到了广泛的应用。

与传统的机器学习方法相比，基于卷积神经网络的深度学习方法在缺陷识别领域具有更高的识别准确率和工作效率。但是这种方法和机器学习方法具有同样的缺点，首先是模型训练需要大量的标签数据，而具有缺陷模式标签的图像是不容易获取的，因为获取带有产品缺陷模式标签的图像需要人工监督，即需要大量有经验的专业人员进行人工标注，这是非常昂贵且耗时的。此外在某些高度自动化的生产场景中，产品的良率特别高，收集缺陷样本非常耗时，而当前的用于缺陷检测的深度学习方法大多是基于大量缺陷样本建立模型，缺陷样本的缺乏导致模型难以上线。针对某些行业比如汽车行业的多型号小批量生产场景（每种型号产品只生产几天），在完成缺陷样本收集前某种型号产品已经不再生产了，这种场景下大量的缺陷样本收集是不可能的。此外，由于缺陷是由生产过程中的非受控因素产生的，缺陷的形态是多种多样的，各种形态的样本很难收集完整，这也限制了深度学习在工业检测领域的应用。

小样本检测算法

为了拓展深度学习在工业检测领域的应用范围及提升易用性，小样本检测算法的研究成为必然。

解决工业检测小样本问题有两种路径，第一种是工程路径，第二种是算法路径。其中工程路径常见有两种方法，第一种是基于真实产品手动制造缺陷，第二种是基于真实图像手动仿真缺陷。这两种方法的优势在于操作简单，产生的缺陷也与真实缺陷比较接近，但劣势也比较明显。基于真实产品手动制造缺陷会对产品造成不可逆的破坏，对于高价值产品破坏成本较高，而且，因为缺陷均由非受控因素产生，手动制造的缺陷不一定与实际缺陷情况完成吻合，会存在一些差异。而基于图像手动仿真缺陷则存在对操作人员要求高，产生速度慢的问题。因此，使用工程路径解决小样本问题可以在一些比较紧急的情况下使用，比如项目初期需要紧急上线时。

算法路径基本思路

从算法路径解决小样本问题，基本的思路有两种，第一种是增加样本，第二种是减少算法对样本的依赖。

1、增加样本

基于第一种思路的算法研究方向有数据增广和缺陷生成，其中数据增广在深度网络训练时为了防止过拟合已成为一个标准手段，站在工业检测的视角上看，数据增广是一种性价比比较高的扩增样本的手段，但因为目前数据增广的方法大多是基于一些传统图像处理方法，所以能仿真缺陷的位置和一些简单纹理变化，但无法仿真缺陷的形状和复杂纹理，所以数据增广一般作为一个基础手段，可以解决一部分小样本问题，对于一些简单场景是有帮助的。而要解决更复杂场景的样本生成问题，需要用缺陷生成算法。

我们将缺陷生成算法的研究分为三个阶段：第一阶段是单一产品单一型号缺陷生成；第二阶段是单一产品多型号缺陷生成；第三阶段是实现跨产品缺陷的生成。

当前缺陷生成算法大致可以分为两种：一种是自动生成算法，整个生成过程完全不需要人工干预，第二种是半自动生成算法，需要一些简单的人工交互。

自动生成算法的典型算法有DCGAN[1] 、WGAN[2] ，输入一张缺陷图像可以直接生成多张真实的缺陷图像。半自动生成算法的典型算法有CGAN[3] 、CVAE[4] 、Pix2Pix[5] ，需要人工交互给定缺陷生成的类别或形状，然后根据给定信息生成指定类型缺陷。但当前无论是自动生成算法还是半自动生成算法，对训练样本的需求量虽然比监督算法少，但还是有一定要求，而且目前还没有一种能在所有数据上通用的解决方案，当前仍需要针对不同的场景制定不同算法版本。通用的缺陷生成算法会这个研究方向下一步的重点。

2、减少算法对样本的依赖

算法路径解决小样本问题的第二个思路是减少算法对样本的依赖，基于这个思路衍生出两条算法路线：

第一条路线是完全不需要缺陷样本的非监督学习算法，基于非监督算法训练模型时仅需要OK图像参与训练即可。

第二条路线仍基于有监督算法，对缺陷样本的需求量大大降低。

非监督算法实现的思路大体上分为两种：

一种是基于生成模型，基本思路是训练一个只能生成OK图像的生成网络，推理时针对输入的NG图像，找到一个与NG图像最接近的OK图像，然后求两张图的差异，根据差异大小判断是否为NG，典型算法有AE，VAE[6] ，Ano-GAN[7] 等。

另一种思路是基于特征表示，基本思路是找个一个较好的特征表示，将OK图和NG图分别映射到高维特征空间，OK图对应特征点的类内距离很小，推理时一张图对应特征点与OK图特征簇的中心距离很远就可以判定为NG，典型算法有SVDD[8] 、OCSVM、DeepSVDD[9] 等。

基于有监督算法减少样本依赖的思路分为两种：

一种是对输入数据进行归一化，降低不同缺陷样本之间的差异，归一化算法基于传统图像处理算法实现，需要针对不同场景做不同的算法设计，很难有通用性，因此仅作为一些临时处理手段。

另一种思路是基于迁移学习，典型的算法研发方向是域适应（Domain Adaption，DA）和域泛化（Domain Generation,DG）。

DA处理的问题要求可以获取一部分目标域的图像，且不能实现跨类别的迁移，因此适合用于处理跨产品型号的问题。DG在DA的基础上，放宽了对目标域数据的要求，可以不需要目标域数据，且可以实现跨类别迁移，因此可以实现跨产品、跨型号、跨缺陷类别的迁移。

DA算法当前研究的基本思路有三种，一是基于差异度量，核心思路是找一个差异度量函数，让源域与目标域样本的特征在这个度量函数下最小，代表算法为MMD[10] ；二是基于对抗，核心思路是通过构造对抗网络，训练一个分类器让判别器无法区分数据是来自源域还是目标域，这样就实现了源域和目标域的融合，代表算法为Dom Confusion[11] ；三是基于重构，核心思路是将构造源域和目标域的通用特征，仅利用通用特征去执行相应的任务，代表算法为Domain Separation Networks[12] 。

DG算法当前的研究思路也分为三种，第一种是推理时选取一个分布最近的源域的模型直接使用，第二种是通过拆解域相关与域无关的组件并进行组合来实现对目标域数据的处理，第三种是训练得到域不变的特征[13] 。

总结

当前基于有监督的缺陷检测算法，在数据量充足的场景下已经逐步成功落地，但工业场景具有一定的离散性，大部分应用场景均为小样本检测场景，小样本问题的解决有助于将AI技术应用于千千万万工厂。虽然当前针对小样本问题有一些初步的解决思路，但该问题的彻底解决需要更深入的研究及更大的投入。阿丘科技将AI For Every Factory作为使命，会坚定不移地持续研究小样本问题，也希望可以和有志于研究工业AI检测问题的工业人一起交流进步，推动小样本问题的彻底解决。

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4787

浏览量
101459
机器学习

机器学习

+关注

关注
66

文章
8458

浏览量
133325

原文标题：如何解决工业缺陷检测小样本问题

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

缺陷检测在工业生产中的应用

自己开发出的SVS系列工业智能软件在缺陷检测的具体应用“充电器字符缺陷检测系统”为例为大家说明。检测

发表于 11-18 13:48

少缺陷样本的PCB焊点智能检测方法_卢盛林

少缺陷样本的PCB焊点智能检测方法_卢盛林

发表于 02-07 16:59 •4次下载

基于小样本重用的混合盲均衡算法

随着人们对通信质量和速度的要求越来越高，传统均衡技术暴露出了越来越多的缺点。混合盲均衡算法因为其高效、适应度高的特点，成为了均衡领域的一个热点。该文提出了一种基于小样本重用的新型混合盲均衡算法。算法

发表于 11-13 11:33 •8次下载

高维小样本分类问题中特征选择研究综述

随着生物信息学、基因表达谱微阵列、图像识别等技术的发展，高维小样本分类问题成为数据挖掘（包括机器学习、模式识别）中的一项挑战性任务，容易引发维数灾难和过拟合问题。针对这个问题，特征选择可以有效避免维

发表于 11-27 16:38 •0次下载

答疑解惑探讨小样本学习的最新进展

至于什么样的情况需要专门设计小样本学习算法，其实这是一个很实际或者很工业的问题，比如在医疗图像处理中解决很罕见的病变，样本量确实不够，我们想去学一个分类器就只能根据这个数据去设计小样本

发表于 05-12 10:20 •4163次阅读

GAN用于（无缺陷样本）产品表面缺陷检测

1.前言深度学习在计算机视觉主流领域已经应用的很成熟，但是在工业领域，比如产品表面缺陷检测，总感觉没有发挥深度学习的强大能力，近几年表面缺陷的相关研究主要是集中在各种借鉴主流神经网

发表于 01-03 11:53 •3330次阅读

深度学习：小样本学习下的多标签分类问题初探

摘要 小样本学习（Few-shot Learning）近年来吸引了大量的关注，但是针对多标签问题（Multi-label）的研究还相对较少。在本文中，我们以用户意图检测任务为切入口，研究了的小样本

发表于 01-07 14:51 •7246次阅读

关于正样本的表面缺陷检测

，然而这些方法往往是需要大量标注数据的有监督学习。在实际的工业场景中，缺陷样本往往是难以收集的，而且标注的成本也十分巨大。针对上述有监督学习在实际应用中存在的问题，本文提出了一种仅基于正样本

发表于 05-29 10:23 •3406次阅读

融合零样本学习和小样本学习的弱监督学习方法综述

融合零样本学习和小样本学习的弱监督学习方法综述来源：《系统工程与电子技术》，作者潘崇煜等摘要: 深度学习模型严重依赖于大量人工标注的数据，使得其在数据缺乏的特殊领域内应用严重受限。面对数据缺乏

发表于 02-09 11:22 •2420次阅读

一种基于伪标签半监督学习的小样本调制识别算法

一种基于伪标签半监督学习的小样本调制识别算法来源：《西北工业大学学报》，作者史蕴豪等摘要：针对有标签样本较少条件下的通信信号调制识别问题，提出了一种基于伪标签半监督学习技术的小样本

发表于 02-10 11:37 •880次阅读

基于深度学习的小样本墙壁缺陷目标检测及分类

近年来，无需人工干预的深度学习已经成为缺陷图像检测与分类的一种主流方法。本文针对室内墙壁缺陷缺检测中数据集大多是小样本的问题，提出了相关的深度学习研究方法。首先，自制墙壁表面

发表于 04-24 09:44 •1次下载

跨域小样本语义分割新基准介绍

继医学图像处理系列之后，我们又回到了小样本语义分割主题上，之前阅读笔记的链接我也在文末整理了一下。

发表于 11-15 10:05 •1762次阅读

基于GAN的零缺陷样本产品表面缺陷检测

缺陷检测是工业生产过程中的关键环节，其检测结果的好坏直接影响着产品的质量。而在现实场景中，但产品瑕疵率非常低，甚至是没有，缺陷

发表于 06-26 09:49 •1226次阅读

如何在缺陷样本少的情况下实现高精度的检测

样本少的情况下实现高精度的检测呢？目前有两种方法，一种是小样本学习，另一种是用GAN。本文将介绍一种GAN用于无缺陷样本产品表面

发表于 06-26 09:54 •1727次阅读

工业产品表面缺陷检测方法研究

了工业表面缺陷检测中常见的关键问题及其解决方法；关键问题包括实时问题、小样本问题、小目标问题、不平衡样本问题。最后对近年来常用的

发表于 08-17 11:23 •1308次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

如何解决工业缺陷检测小样本问题

评论

缺陷检测在工业生产中的应用

少缺陷样本的PCB焊点智能检测方法_卢盛林

基于小样本重用的混合盲均衡算法

高维小样本分类问题中特征选择研究综述

答疑解惑探讨小样本学习的最新进展

GAN用于（无缺陷样本）产品表面缺陷检测

深度学习：小样本学习下的多标签分类问题初探

关于正样本的表面缺陷检测

融合零样本学习和小样本学习的弱监督学习方法综述

一种基于伪标签半监督学习的小样本调制识别算法

基于深度学习的小样本墙壁缺陷目标检测及分类

跨域小样本语义分割新基准介绍

基于GAN的零缺陷样本产品表面缺陷检测

如何在缺陷样本少的情况下实现高精度的检测

工业产品表面缺陷检测方法研究