0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

友思特方案 让笔划浮动:无代码的深度学习实现多领域的字符检测

Hophotonix 来源:Hophotonix 作者:Hophotonix 2024-11-13 11:47 次阅读

导读

提取多种多样字符的信息有利于在日常生活和工业生产中落实标准化和规范化的要求。友思特 Neuro-T的OCR模型基于无代码深度学习算法,轻松实现了精准高效的字符检测

在现代生活和工业领域,字符检测技术应用正变得越来越重要。无论是在日常生活中对扫描文档的自动识别,还是在工业生产线上的自动化检测,准确提取和解析字符信息都是关键。

然而,这一任务面临着诸多挑战。首先,字符的多样性和变异性,如字体、排版和手写体的不同,使得识别过程复杂且易出错。其次,实际应用中常见的数据噪声和格式不规范问题,会影响检测的准确性。再者,大规模数据处理需要高效的实时性能,这对系统的处理能力提出了严格要求。

针对这些难点,友思特技术人员基于Neuro-T的OCR模型,使用深度学习的方式,通过训练强大的模型和优化算法,结合前置传统图像处理算法,能够在各种复杂环境下实现高效的字符检测,为生活和工业应用提供了可靠的技术支持。

wKgaomYWXSqASr8cAACdvCq_NV4595.png

友思特Neuro-T支持的深度学习模型类型

友思特 Neuro-T 支持九种不同的深度学习模型

监督学习
分类 wKgZoWc0H2yAK5R7AAY5wDzRMkY690.png 将图像分类为多个缺陷类别(一副图像只能包含一类缺陷)
分块分类 wKgZoWc0H5CARNmfAAm_4aD_V2E798.png 通过将高分辨率图像分割成小块来进行分类(一幅图像可能包含多类缺陷)
实例分割 wKgZoWc0H5WAV25tAANjyBMdwIg231.png 在像素级检测缺陷的精确形状和位置(能在一张图像中检测出多个缺陷)
目标检测 wKgaoWc0H5uATgD4AAfO6Cw_fqE851.png 识别物体数量并确定其位置
OCR字符识别 wKgZoWc0H6aAfHuuAA-LPcs_BsM213.png 识别图像中的文字(英文、数字、特殊符号)
旋转 wKgaoWc0H6-AQDFWAAX6l9y8AdE689.png 自动将原始图像旋转到正确方向
GAN对抗生成网络 wKgZoWc0H7KADtjRAAXWV4OLKdA413.png 生成与真实缺陷相似的人工缺陷图像
无监督学习
异常分类 wKgZoWc0H7qABH7AAArGLdFLY_A294.png 以热力图的形式为二元分类提供基础,仅对正常图像进行训练
*正常/缺陷
异常分割 wKgZoWc0H72AG5dwAAYmP7h40s4853.png 像素级别检测缺陷区域,仅对正常图像进行训练

Neuro-T的OCR模型训练字符检测模型的具体操作步骤

新建项目→新建数据集→导入图像数据

wKgaoWc0H_WAClv7AADmWT2cG4I983.png

2. 创建标签集→选择模型类型(OCR)

wKgZoWc0H_qAbEYnAAICFfMchxU881.png

3. 标注数据

可以使用手动标注或自动标注的方式对图像进行字符内容的标注。

(1)手动标注

将图像中的文字旋转到合适的朝向;

选择绘制矩形框、设置大小写类型以及字符排布方向;

在图像中需要标注的字符位置绘制矩形框并填写字符内容。

wKgaomc0ICmATi2kAAK_EZLs8y0936.png

(2)自动标注

Neuro-T自动学习平台的OCR深度学习模型提供了两种自动标注方式:

①预训练模型自动标注:

使用Neuro-T平台自带的预训练OCR模型对数据集进行自动批量快速标注,再微调标注结果。

wKgZomc0IEmAb0yyAAAaX19C8DE081.png

②自定义模型自动标注:

手动标注部分图像来训练OCR模型,选择用于标注的OCR模型,再应用到想要标注的图像上即可。

wKgZomc0IE6ALS7jAAEL71QqcPg267.png

4. 划分训练集和测试集

自动或手动按预设比例将图像集分配为训练集和测试集。

wKgaomc0IFmAMIXtAAE8WEn1gKY362.png

5. 训练生成OCR模型并查看模型结果

在模型训练页面输入训练的模型名字即可进行OCR模型训练,无需参数设置,最后可以查看OCR模型的评估指标结果。

wKgaomc0IGCADEbLAAE-ahFdALk767.png

正则匹配技术

通过OCR模型识别客户检测对象中的字符内容,往往还没能解决客户的需求。客户需要的是自动化从中提取分析出所需要的信息,并且排除冗余信息,或者替换部分检测信息为其他字符内容。这个时候,我们通常会选用正则匹配的方式来为客户实现。

正则匹配(正则表达式匹配)是一种用于在文本中查找特定模式的技术。正则表达式(regex)是一种强大的文本处理工具,可以用于匹配、搜索、替换文本。它广泛应用于数据验证、文本处理、数据清理等场景。

例如”d{3}-d{4}-d{4}”用于匹配类似”020-1234-5678”的电话号码信息。

例如”^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}$”用于匹配邮箱地址。

客户案例

场景1:工件的蚀刻/凹刻字符检测

金属工件表面通过物理或化学反应形成的凹陷字样的字符检测需求。由于字符内容与背景无明显颜色差异,需要搭配一定的光源进行打光来凸显字符内容的轮廓,再行调用OCR模型进行字符检测。

wKgZomc0IKaARSlsAAO4KthHvyY428.pngwKgaomc0IKqAOQP2AAJe98kqqoQ021.png

场景2:医药溶媒字符检测

检测医疗袋装溶媒上面的字符,并使用正则匹配的方式,从中提取出溶媒种类、容量、浓度等信息传输至上位机

wKgaomc0IK6APP6FAAM5ePsDk4A573.pngwKgZomc0ILKAA-PdAAIrUbqGvko623.png

场景3:物流纸箱打标字符检测

物流纸箱位于传送带上实时传送,架设 IDS 相机进行实时动态拍摄并返回上位机字符识别结果。由于纸箱粗糙表面存在噪点对字符识别造成干扰,且字符印刷颜色较浅,直接识别存在一定的难度,因此采用包括灰度化、Gamma校正、提高全局对比度、二值化、高通滤波和开运算等一系列图像处理操作,得到的图像再调用OCR模型进行检测,返回检测结果。

wKgZomc0ILiAPTxkAAMczbp7udg533.png

场景4:饮料包装生产日期检测

检测易拉罐底部或盒装饮料顶部的印刷字符,并从中提取出产品的生产日期。

wKgaomc0ILyAL9bBAAZLN_qLrY0622.pngwKgaomc0IMGAYlAqAAf_c1LErTk874.png

其余常见场景

①车牌识别:

wKgZomc0IMWAHf4dAAcPLlqkguY066.pngwKgZomc0IMmABNYvAANkG3F5w4I773.png

②高铁票识别:

通过正则匹配的方式从检测到的字符数组中匹配提取出包括站点、时间、座位等信息。

wKgZomc0IM2Ab0iLAAU4YvasRuA208.png

* 客户现场真实数据保密,替代图片来源网络,侵删。

友思特字符检测系统套装

Neuro-T

Neuro-T 使用简单的图形用户界面,通过自动优化深度学习模型结构和训练参数来创建出性能最佳的模型,无需任何深度学习经验,即可运行自己的深度学习项目。在系统中,Neuro-T 是用于训练模型的核心工具。

2D 工业相机

友思特 2D 工业相机结合了支持USB3视觉标准的高质量全局快门传感器技术和具有成本效益的uEye XCP相机平台,是流行的USB2接口的uEye LE相机系列的最佳、高性能和长期替代品。借助友思特自研视觉软件 VST-2D,对接IDS相机的实时图像流,即可获取PCB的实时图像数据。

了解更多?欢迎访问官网,探索丰富案例:https://viewsitec.com/neurocle/

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • OCR
    OCR
    +关注

    关注

    0

    文章

    144

    浏览量

    16316
  • 深度学习
    +关注

    关注

    73

    文章

    5485

    浏览量

    120936
  • 字符检测
    +关注

    关注

    0

    文章

    3

    浏览量

    680
收藏 人收藏

    评论

    相关推荐

    应用 FantoVision边缘计算:模态传感+AI算法=新型非接触式医疗设备

    基于模态传感技术和先进人工智能技术可有效提升乳腺癌检测的精准性、性价比和效率。 FantoVision 边缘计算机 则为其生物组织数
    的头像 发表于 10-30 16:26 135次阅读
    <b class='flag-5'>友</b><b class='flag-5'>思</b><b class='flag-5'>特</b>应用  FantoVision边缘计算:<b class='flag-5'>多</b>模态传感+AI算法=新型非接触式医疗设备

    方案 基于三维点云实现PCB装配螺丝视觉检测

    三维点云是完成精密化 PCB 检测的最新视觉技术。 Saccde Vision 视觉扫描系统,采用先进的三维成像技术和算法输出直观点云图,进一步确保了PCB生产的可靠性与稳定性能
    的头像 发表于 08-28 16:35 256次阅读
    <b class='flag-5'>友</b><b class='flag-5'>思</b><b class='flag-5'>特</b><b class='flag-5'>方案</b>  基于三维点云<b class='flag-5'>实现</b>PCB装配螺丝视觉<b class='flag-5'>检测</b>

    新品 光谱与高光谱相机:基于随心而定的可调谐滤光片技术

    高光谱成像拓展了人类的视野,让我们能看到可见光之外的东西。高光谱相机与光谱相机基于可调谐滤光片技术,具备紧凑、高分辨率、低成本的优势,将其应用拓展至智慧农业、工业
    的头像 发表于 08-09 17:36 334次阅读
    <b class='flag-5'>友</b><b class='flag-5'>思</b><b class='flag-5'>特</b>新品 <b class='flag-5'>多</b>光谱与高光谱相机:基于随心而定的可调谐滤光片技术

    深度学习中的监督学习方法综述

    应用中往往难以实现。因此,监督学习深度学习中扮演着越来越重要的角色。本文旨在综述深度
    的头像 发表于 07-09 10:50 450次阅读

    应用 | 模型链接一应俱全:IC类别视觉检测一站式解决方案

    高精度IC制造工艺需要对产品进行全方位检测以保证工艺质量过关。 Neuro-T 通过调用平台的流程图功能,搭建
    的头像 发表于 06-18 18:19 447次阅读
    <b class='flag-5'>友</b><b class='flag-5'>思</b><b class='flag-5'>特</b>应用 | 模型链接一应俱全:IC<b class='flag-5'>多</b>类别视觉<b class='flag-5'>检测</b>一站式解决<b class='flag-5'>方案</b>

    应用 | 健康观察更可靠:刚性内窥镜的自动视觉检查

    近代医学实践推动了刚性内窥镜的广泛应用,也促进了精准且高质量的内窥镜自动化检测需求。伙伴 IDS 的 uEye LE 工业相机,通过集成至内窥镜测试仪 LightControl,
    的头像 发表于 05-29 17:54 373次阅读
    <b class='flag-5'>友</b><b class='flag-5'>思</b><b class='flag-5'>特</b>应用 | <b class='flag-5'>让</b>健康观察更可靠:刚性内窥镜的自动视觉检查

    应用 | 低成本OCT成像技术,助力软包电池极耳胶带多维度检测应用

    新能源电动汽车的发展促进了高性能电池材料的机器视觉检测技术需求。采用低成本光学相干断层扫描技术,满足2D/3D成像、分析内部外部尺寸与缺陷、高精度无损
    的头像 发表于 05-23 15:04 693次阅读
    <b class='flag-5'>友</b><b class='flag-5'>思</b><b class='flag-5'>特</b>应用 | 低成本OCT成像技术,助力软包电池极耳胶带多维度<b class='flag-5'>检测</b>应用

    应用 | 稳步前行:基于FPGA 3D相机实现轮胎定位检测应用

    乘用车辆的长期稳定行驶离不开轮胎等零部件的定期检测 3D相机可实时采集车辆四轮的三维点云图,提取关键信息并进行计算分析,实现车辆四轮
    的头像 发表于 04-24 17:00 337次阅读
    <b class='flag-5'>友</b><b class='flag-5'>思</b><b class='flag-5'>特</b>应用 | 稳步前行:基于FPGA 3D相机<b class='flag-5'>实现</b>轮胎定位<b class='flag-5'>检测</b>应用

    应用 | 高精度呈现:PCB类型缺陷检测系统

    高精度呈现!PCB类型缺陷检测系统,借由深度学习
    的头像 发表于 04-10 17:51 826次阅读
    <b class='flag-5'>友</b><b class='flag-5'>思</b><b class='flag-5'>特</b>应用 | 高精度呈现:PCB<b class='flag-5'>多</b>类型缺陷<b class='flag-5'>检测</b>系统

    方案 | 构建缤纷:可调谐光源的荧光成像的应用

    生物荧光分析常常伴随使用多种荧光染料的需求。可调谐光源荧光检测成像解决方案,结合通道光源
    的头像 发表于 04-02 17:24 463次阅读
    <b class='flag-5'>友</b><b class='flag-5'>思</b><b class='flag-5'>特</b><b class='flag-5'>方案</b> | 构建缤纷:可调谐光源的荧光成像的应用

    新品 | 采集新势力:模块化视频采集与回放系统

    新品proFRAME重磅发布,是用于采集、回放和处理原始视频数据流的模块化解决方案,支持多种常见传输技术,广泛应用于汽车、医疗和工业等领域
    的头像 发表于 03-26 16:45 468次阅读
    <b class='flag-5'>友</b><b class='flag-5'>思</b><b class='flag-5'>特</b>新品 | 采集新势力:模块化视频采集与回放系统

    伙伴IDS来访!

    与展望。 诚挚来访 热情接待 2024年3月11日下午, 深度战略合作伙伴——国际领先机器视觉解决方案提供商 IDS  应邀到访我司。
    的头像 发表于 03-19 16:57 426次阅读
    <b class='flag-5'>友</b><b class='flag-5'>思</b><b class='flag-5'>特</b>伙伴IDS来访!

    描绘未知:数据缺乏场景的缺陷检测方案

    了解更多方案细节,欢迎您访问官网(Neurocle | 机器视觉 光电检测 ) 导读 深度
    的头像 发表于 01-25 10:46 492次阅读
    描绘未知:数据缺乏场景的缺陷<b class='flag-5'>检测</b><b class='flag-5'>方案</b>

    分享 | OCT成像技术:突破传统限制,掌握内部缺陷图像,轻松实现深度检测

    OCT成像技术克服了传统视觉相机技术无法获得内部缺陷图像与深度检测的问题,是断层截面成像利器。OQ LabScope系列便携式小巧紧凑
    的头像 发表于 12-20 14:49 1096次阅读
    <b class='flag-5'>友</b><b class='flag-5'>思</b><b class='flag-5'>特</b>分享 | OCT成像技术:突破传统限制,掌握内部缺陷图像,轻松<b class='flag-5'>实现</b><b class='flag-5'>深度</b><b class='flag-5'>检测</b>

    Neuro-T:零代码自动深度学习训练平台

    Neuro-T为传统的深度学习视觉检测方案
    的头像 发表于 11-24 17:58 573次阅读
    Neuro-T:零<b class='flag-5'>代码</b>自动<b class='flag-5'>深度</b><b class='flag-5'>学习</b>训练平台