0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

工业AI视觉进化论

新机器视觉 来源:ACT工业AI 2023-06-13 15:01 次阅读

前言

我自己是做算法出身,喜欢思考问题的本质。比如,AI对于我们整个工业视觉的本质到底是什么。今天我把这个不仅是我的思考,也是阿丘科技整个公司的思考分享给大家,供大家参考。但这也是一个比较初级的思考,要在以后的实践中深化。

今天我讲的内容包含三个主题,第一个是讲AI对于工业视觉到底意味着什么;第二个是我们从整个技术发展周期的角度,看一看工业AI视觉发展的一个大的路线图;第三个,也是必不可少的,要谈一谈我们对未来的一个趋势和观点的一些理解。

AI重构工业视觉

算法

82498a70-0986-11ee-962d-dac502259ad0.png

首先我们来看第一个主题,AI对于工业视觉算法到底有什么价值?

传统算法,我用两个关键词来定义它,就是定量分析和特征工程。特征工程就是算不同的特征。后面做判断的时候,一堆的if···else···是传统算法的一个特点。那AI这块的话大家已经很了解了,基于样本来做学习。我认为这是很本质的一个东西。

从功能角度出发,工业视觉算法可分为图像处理、定位、检测、测量、识别;从算法实现技术角度就是分类、识别、测量三大类。本质上,工业视觉算法将会或正在被AI全部重构,当然如果涉及到测量技术,即定量分析技术,传统算法依然不可或缺。

AI重构工业视觉算法的价值体现在以下 3 个方面:

1. 升维

AI通过升维来解决我们的一些复杂的分类和识别问题。包括复杂的背景、低对比度、柔性电子、一些强干扰。这些东西原来传统方法是没问题的,但是用AI的话,我觉得能更加好。这个点大家是能够肉眼可见的。后面第二点和第三点可能未必肉眼可见,但实际上是更关键的。

2. 简化、通用化

AI的一大优势是可以对算法问题做极度的抽象,抽象之后较为复杂的工业视觉问题就会变得比较简单,还有一个就是通用化。很多工业视觉里面比较复杂的算法问题,用两到三个比较通用的算法模块去训练数据,结果就出来了,并且这个指标还非常优秀。

3. 降本

大家听到这个东西好像有点反直觉,觉得AI对算力有要求,怎么还能降本?

我们举一个所有做传统算法的人都能够理解的一个例子。比如几何形状匹配,这个属于是整个机器视觉里面,传统算法绕不过的这样的一个算法,它需要设置非常多的参数。如果要用好,工程师需要理解几何匹配算法的基本原理、参数的物理含义,这需要较为专业的图像处理背景知识,门槛要求高。如果你理解不到位,可能定位的结果不是你想要的,或者达不到一个非常精准的效果。要做到这一点的话,是需要有图像处理算法背景的。所以说我原来做传统图像,就是我在原来东家的时候,我们带着底下的应用工程师都是硕士,这个成本是非常高的。

而我们用 AI 来做,比如说我们只是训练三、五个样本,甚至是一个样本,后面整个定位的精度跟效率都能够达到,甚至超过传统算法的精度。当然,整个鲁棒性肯定也比传统算法要好。那这样使用的成本就可以降到非常低。

解决方案

82ab5c78-0986-11ee-962d-dac502259ad0.png

这个解决方案的范畴是什么?可以说是视觉系统范畴,也可以说是视觉检测设备范畴。叫解决方案,就是基于算法叠加的一个完整方案。我们内部的观点是,AI不仅仅是一个技术模块,它是一种新的认知框架,本质上是基于数据和标准驱动的。首先我们要有这么一个认知框架,再往下看我们的视觉解决方案,核心包括哪些部分?对这些部分意味着是什么?

我抽取了里面三个核心部分:

1. 成像模组

成像模组就是整个机器视觉里面成像的所有器件跟方案,它背后的基本原理是什么?是基于传统算法,而传统算法基于定量分析。所以说我们基于传统算法来做的成像方案,它的底层要求是“定量、高对比度”。

这个会导致什么样的后果?比如说我们要检测一个表面很多不同类型的缺陷。为了要达到高对比度的定量,可能我需要打若干场光。可能每场光对应两种缺陷,后面才能把这些缺陷完整的呈现出来,成像的效率非常低。

而我们进入AI时代以后,我们对成像的要求变了,只要是目视可见即可。当前基于传统算法构建的成像方案,本质上还只是一个“光电转换器”。只是把一个关键信号转换成图像,距离我们所说的眼睛差的太远了。当然,我们也不可能一步跃成眼睛,那至少阶段性的目标我们是不是可以达到摄影水准。这个做到了有什么好处呢?一方面是能够提高我们整个成像的空间效率,更重要的是它简化了、通用化了、成本低了。这是很重要的一个根本变化。

2. 算法模组

客观来说,当前落地的各种项目,成本还是比较高的。根源在于大部分只是把AI作为一个算法模块,把它叠加到原来的体系里面,就比较低效。后续算法方案一定要以AI为中心,打通和优化整个计算流和数据流,这个才是最优的方式,能够提高训练推理效率、降低部署维护成本。

3. 自动化模组

在传统算法时代,由于成像有很多约束,自动化能发挥的作用非常受限。AI其实是打破了算法的束缚,本质上也打破了我们成像的束缚。可以自动化帮我们拍图,各种“凹姿势”“摆造型”。只要能将缺陷拍清楚就可以,并不需要那么明亮的成像。如果这么来做的话,极大地降低了自动化复杂度,提高了自动化通用性。并且能够比较简单高效地解决产品异形、多型号小批量等成像难题。

从大的维度来看,工业视觉解决方案会按两个极端方向演进:

- 轻量级场景:更强调一体化,极致的简单易用,可能需要线上训练。

- 复杂场景:更强调通用化解决方案,包括:通用成像模组、通用大模型、通用自动化模组,降低全链路综合成本。

工业AI视觉进化论

8306f4fc-0986-11ee-962d-dac502259ad0.png

任何技术导入都有它的一个生命周期,每个阶段有不同的特点。基于落地多个项目的思考,我们将AI工业视觉发展路径划分为三个阶段:早期市场时期(2019)、保龄球道时期(2024)、龙卷风时期(2029)。

- 2019年是AI工业视觉元年,意味着有相关的AI项目落地,即早期市场。阿丘也是在这一年开始逐步项目落地,我们的第一个落地项目是3C行业的模组外观检测。

- 自 2021年开始,AI逐步在各细分市场成为标配,该趋势将延续到2024年,即所谓的保龄球道时期。阿丘从2021年开始在结构件、模组、包装等众多细分市场批量落地。

- 预计在 2029年, AI 将在全域市场普及,即龙卷风时期。

这是一个大概的判断,时间周期有可能会早或晚,仅供大家参考。

早期市场时期(2019):技术创新

8359ea40-0986-11ee-962d-dac502259ad0.png

我们首先来看一下早期市场有什么特点?

核心还属于是技术创新的一个时期。换句话说,AI这个东西在工业视觉里面到底能不能用,比较专业的说法就叫技术创新导向。

那么工业AI算法跟我们自然场景(比如人脸识别、自动驾驶)的技术到底有什么差别?一是小样本,大家知道缺陷是由非受控因素产生的,获取成本很高,所以需要小样本;二是高精度,包括尺寸小、对比度低、过检率和漏检率指标严格,特别是关键缺陷要达到零漏杀;三是低算力,本质上是由于工业产品对成本有约束。

正是基于这些洞察,我们构建了自主底层算法框架、上层算法工具,即大家耳熟能详的工业 AI 视觉软件平台AIDI。

在推AIDI的过程中,有两个比较有意思的点,在这里与大家分享下:

1、设备厂商甚至集成商大部分都有自研基础AI算法的冲动,基本都无疾而终。甚至这个公司可能只有五六个人,他也安排一个人来自研。核心原因就两个:一是有很多开源的框架;二是确实把这些数据拉到框架里充分跑一跑能看到不错的指标。但是真正上线时会受三个约束,即小样本、高精度、低算力。所以很多人可能做到后面无法突破这三个约束,慢慢地就悄无声息了。

通过和客户的交流和我个人的思考,我认为其实它是一个经济学问题,不是一个技术问题。我们在传统算法时代,用OpenCV去做项目也能做一部分,但是大部分的系统和设备,还是一定要用专业的平台软件来做。在AI这个时代我认为也是一样的。能不能自研AI算法呢?我认为是比自研传统算法更难的。主要是三个方面:第一个方面,自然场景跟工业场景的问题特性有非常大的差别;第二个方面是AI算法的参数维度更多;第三个,要达到低算力,需要对算法做高性能优化,优化复杂度是非常高的。如果一个公司真的要自研AI算法,投入的强度要很高,要有很多工程师,所以我觉得最终它实际上是一个经济学问题。

总的来说,如果大家投入资源的强度足够,我认为也能够做一个至少能用的东西,但如果要做到更好,就看你有没有天花板足够高的研发人员。

2、有些人问我,做传统算法的视觉厂商来做AI算法是更容易还是更难?针对这个问题我还真是进行了深度的思考,这也是我想给大家分享的第二个点。其实我认为是更难,可能比一个完全初创的公司还更难。为什么?本质上AI算法和传统算法的架构和迭代方式完全不同,研发理念也是天壤之别。要从传统算法的方式切换到AI,我不是说没有可能,只是概率较小。

阿丘落地的第一个项目是3C模组外观检测,这个项目是有一定复杂度的。其中涉及注塑件、金属件等多种材料组合,产品异形,缺陷种类多达70余种、形态多变。 检测要求漏检率低于0.1%,过检率3%左右,以传统算法视角看来该项目基本无解。我们从方案到样机上线花了超过6个月的时间,在项目进行过程中,我们发现 POC指标和上线指标之间存在巨大鸿沟。为什么会有这个鸿沟?我认为主要有四个方面:

第一个就是对AI的认知。它到底能解决什么问题?不能解决什么问题?所谓AI是不论复杂度的,只要学习过的,再复杂也可以解决,没学习过的再简单也无法解决。

第二个是对需求边界的认知。AI本身无法分辨正确与错误,这意味着你给它错误的样本,它也会学习。从这个角度,他对标准是有很严格的要求的。

第三个是对数据的管理。核心主要是两个点,如何把握标注的标准以及如何筛选对迭代模型有信息量的数据。标注标准太严苛,成本太高;不够严苛,标准对AI来说又不明确。

最后一个是模型相关的问题。如何保证指标的稳定性和在产线间进行复制。比如,不同的产品型号该如何做到兼容。

为了解决这些问题,我们基于项目经验,提炼出了AI落地方法论,比较成熟的方法,就会成为AIDI产品功能的一个组成部分。

该阶段客户的特征:拥抱新技术、有痛点、有一定支付能力。我认为这三个特征缺一不可。这样来看,早期我们项目落地在3C行业是有其必然性的,因为以Apple为主驱动的3C供应链是最早拥抱新技术的行业之一。并且在3C供应链中,自动化程度最低的就在质检环节。

前几年疫情引起的人员受限等问题更加推动了检测自动化。由于检测问题的复杂性,传统算法时代实现检测自动化可能性非常小。当然也做了一些AOI,但实现的效果不太好,没有一个真正的解决方案。可能你上了一台设备,但还需要更多的人来维护这台设备。AI提供了全新的强力的技术手段,和更多的可能性!

保龄球道时期(2024):产品创新

837c04b8-0986-11ee-962d-dac502259ad0.png

早期市场阶段,我认为是找一些场景落地,后面到了保龄球道时期,一定是在细分市场。

这里面的一个焦点就是产品创新。从算法维度来看就是算法的标准化,包括工具链标准化。把前面说的那套落地方法论抽象成一套工具,集成到产品中,让大家更方便地使用。从解决方案维度,核心点在于创新简化。发掘AI特性,在提高检测性能的同时,简化成像、算法、自动化解决方案,缩短产品上市周期,降低产品生命周期综合成本。

该阶段客户的特征:有痛点且关注性价比。我们认为这个阶段还需要延续两到三年的时间。

龙卷风时期(2029):行业价值链重构

下一个时期就是龙卷风时期,重点在于重构行业价值链。

该时期的前置条件是杀手级产品的出现,该杀手级产品把行业价值链卷一遍,在暴风过后,将会呈现新的价值链格局。比如,移动互联网时代的杀手级产品就是iPhone。视觉行业的杀手级产品是康耐视的VisionPro,有了这个产品才定义了我们现在提到的很多术语。那AI时代的杀手级产品是什么?这个还是需要由市场来选择。

龙卷风时期的重要特征:大量“伪AI公司出现”。特别是传统视觉公司没有涉及AI也纷纷披上AI的外衣,因为大家都感知到暴风即将来临,想跟上风潮的同时又恐惧被暴风卷走。

演进趋势观点

8396497c-0986-11ee-962d-dac502259ad0.png

最后我来分享下我们对未来3-5年AI演进趋势的一些观点。

第一个是算法方面:第一个是非监督,这个主要针对轻量级场景;第二个是大模型,前面提到对于复杂场景,大模型是最佳机会;最后一个是轻量化,即低算力,低成本是工业视觉永恒的关键维度。

第二个趋势属于解决方案。第一个核心还是简化和通用化,前面提到的成像、算法自动化都是属于简化、通用化。还有一个是全链路的成本优化。这是什么意思?一个行业要达到最大化普及,成本是很关键的一个因素。整个链条包括硬件、算力、开发成本、部署成本、维护成本,如何实现整体最低。

第三个我认为是整个行业大的趋势。未来五年左右,一定会出现杀手级产品。这个产品的出现靠能力,也要靠点运气,最终它是由市场筛选出来。整个行业将会因为这个杀手级产品重新洗牌。这个杀手级产品的出现将影响什么?我分享一下我个人的观点:第一个就是不了解AI的工程师可能将被淘汰。还有一个就是传统的视觉公司从业者能不能在大的图景里面创造价值,否则也会被淘汰。这个我们可以用时间来检验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4586

    浏览量

    92465
  • AI
    AI
    +关注

    关注

    87

    文章

    29665

    浏览量

    268004
  • 工业视觉
    +关注

    关注

    0

    文章

    67

    浏览量

    7111

原文标题:工业 AI 视觉进化论

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI干货补给站 | 深度学习与机器视觉的融合探索

    在智能制造的浪潮中,阿丘科技作为业界领先的工业AI视觉平台及解决方案提供商,始终致力于推动AI+机器视觉技术的革新与应用。为此,我们特别开设
    的头像 发表于 10-29 08:04 145次阅读
    <b class='flag-5'>AI</b>干货补给站 | 深度学习与机器<b class='flag-5'>视觉</b>的融合探索

    阿丘科技钟克洪演讲全文:工业视觉进入AI-Native大时代

    收官。阿丘科技也以其前沿的AI技术实践,为观众带来一场AI+工业视觉盛宴。在工业应用研讨会现场,阿丘科技研发副总裁钟克洪围绕“
    的头像 发表于 07-17 08:25 702次阅读
    阿丘科技钟克洪演讲全文:<b class='flag-5'>工业</b><b class='flag-5'>视觉</b>进入<b class='flag-5'>AI</b>-Native大时代

    什么是工业机器视觉?它有哪些作用?

    工业机器视觉,是指利用计算机视觉技术和图像处理技术,对工业生产过程中的各种图像进行自动识别、定位、检测等操作的技术。它是工业自动化和智能制造
    的头像 发表于 06-17 10:18 669次阅读

    天合光能发布Potentia蓝海2,重塑光储智造新篇章

    近日,天合光能在上海浦东隆重召开“工商储进化论”新品发布会,行业首款AI仿生液冷工商业储能系统Potentia蓝海2正式亮相,标志着光储领域又一次颠覆性的技术创新。
    的头像 发表于 06-14 15:14 562次阅读

    天合光能发布行业首款AI仿生液冷工商业储能系统Potentia蓝海2

    重塑光储设计,颠覆智造想象,2024年6月12日,天合光能“工商储进化论”新品发布会于上海浦东隆重召开,行业首款AI仿生液冷工商业储能系统Potentia蓝海2重磅登场。秉持产品优化、技术创新、服务精进、场景拓展的四维升级理念,天合依托领先的研发优势及深耕市场的渠道能力,
    的头像 发表于 06-14 11:17 575次阅读

    图解阿丘科技CEO《AI+工业视觉探索与展望》主题演讲精彩内容

    本文旨在总结回顾阿丘科技CEO黄耀《AI+工业视觉探索与展望》的主题演讲。扫描二维码留言,专人客服将通过微信为您发送高清原版PPT资料,或点击文末“阅读原文”下载。1、工业
    的头像 发表于 06-05 08:24 517次阅读
    图解阿丘科技CEO《<b class='flag-5'>AI</b>+<b class='flag-5'>工业</b><b class='flag-5'>视觉</b>探索与展望》主题演讲精彩内容

    英特尔机器视觉AI解决方案助力生产力升级

    5月21日-22日,北京机器视觉助力智能制造创新发展大会在北京国际会议中心圆满举行。本次大会以“Vision+AI引领新质生产力”为核心主题,聚焦“3D视觉与精准成像、AI大模型、
    的头像 发表于 05-30 17:14 456次阅读
    英特尔机器<b class='flag-5'>视觉</b>与<b class='flag-5'>AI</b>解决方案助力生产力升级

    PROPHESEE 携手 AMD,推出业界首款兼容 Kria™ KV260 视觉 AI 入门套件的事件视觉解决方案

    基于 Prophesee Metavision® 事件视觉传感器和 AI算法在性能、功耗及速度上的优势,开发人员现可打造支持 AMD 平台的全新一代边缘 AI 机器视觉应用。   20
    发表于 05-30 10:41 919次阅读
    PROPHESEE 携手 AMD,推出业界首款兼容 Kria™ KV260 <b class='flag-5'>视觉</b> <b class='flag-5'>AI</b> 入门套件的事件<b class='flag-5'>视觉</b>解决方案

    阿丘科技:生成式AI与行业视觉大模型驱动工业AI视觉2.0

    5月21日,阿丘科技CEO黄耀应邀参加北京机器视觉助力智能制造创新发展大会,并发表《AI+工业视觉探索与展望》主题演讲,下文根据黄耀先生的主题演讲主要内容撰写而成。可点击文末“阅读原文
    的头像 发表于 05-25 08:25 702次阅读
    阿丘科技:生成式<b class='flag-5'>AI</b>与行业<b class='flag-5'>视觉</b>大模型驱动<b class='flag-5'>工业</b><b class='flag-5'>AI</b><b class='flag-5'>视觉</b>2.0

    AIDI工业AI视觉检测软件介绍

    AIDI是一款基于深度学习的智能工业视觉平台应用于多种工业应用场景,有效解决复杂缺陷的定位识别、分类定级及字符识别等问题,具有强大的兼容性。AIDI 内置多种应用模块,无需编程,帮助用户快速构建和迭代模型,满足不同业务场景下的差
    发表于 03-25 21:52

    越影视觉,让AI看见这世界的繁花

    视觉领域,将是AI最先爆发的地方
    的头像 发表于 03-15 10:04 1078次阅读

    机器视觉工业视觉和计算机视觉这三者的关系

    机器视觉工业视觉和计算机视觉这三者的关系
    的头像 发表于 01-24 10:51 1136次阅读
    机器<b class='flag-5'>视觉</b>、<b class='flag-5'>工业</b><b class='flag-5'>视觉</b>和计算机<b class='flag-5'>视觉</b>这三者的关系

    工业视觉与计算机视觉的区别

    工业视觉主要解决以往需要人眼进行的工件的定位、测量、检测等重复性劳动;计算机视觉的主要任务是赋予智能机器人视觉,利用测距、物体标定与识别等功能实现对于外界位置信息、图像信息等的识别与判
    发表于 01-16 10:06 504次阅读
    <b class='flag-5'>工业</b><b class='flag-5'>视觉</b>与计算机<b class='flag-5'>视觉</b>的区别

    工业机器视觉SmartGS技术引领工业视觉革新

    思特威面阵系列产品可赋能以下四大场景智能化升级,确保无失真的成像和高速的图像采集性能,为高端工业机器视觉应用带来了更精确、高效的视觉检测、质量控制和生产优化能力,显著提升工业生产的效率
    发表于 12-12 14:42 406次阅读

    AI视觉识别有哪些工业应用

    AI视觉识别涵盖多种应用,如人脸识别、目标检测和识别、图像分割、行为识别、视频分析等。本篇就简单介绍一下AI视觉识别的应用场景。
    的头像 发表于 11-27 18:05 1134次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>视觉</b>识别有哪些<b class='flag-5'>工业</b>应用