0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OCR识别技术

新机器视觉 来源:企通查 作者:企通查 2021-03-12 09:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在爬虫对验证码进行破解时,经常需要对图片中的文字内容进行识别,这时就需要用到OCR技术了,那么 OCR识别技术是如何实现对文字内容“即拍即得”的呢?

OCR(Optical Character Recognition)即光学字符识别技术,实质属于计算机输入技术。OCR通过利用光学技术与计算机技术对图片、纸张、物体等处的文本内容进行分析识别,并读取转换成计算机和人类都能理解接受的格式。

OCR主要可以分为手写体识别和印刷体识别。

由于印刷体都是计算机自助生成再进行输出,通常较为规律,因此较手写体识别来说要更简单。而手写体由于往往会带有个人特色,每个人的风格不尽相同,由于其千人千面的特性,手写体识别也成了OCR界一直想攻克的难关。当然,除了手写体与印刷体外,OCR也可以根据识别内容来分类。例如按语言分类,要识别的内容将可能包括汉语、英语、日语、法语等,而如果仅满足国人需求,要识别的内容就可能会包括汉字、英文字母、阿拉伯数字、标点符号等。

通常根据要识别的内容不同,识别的难度也不同。比如仅识别阿拉伯数字,只需能识别出0-9,而英文字母则需要识别52个字符(仅考虑大小写),而中文识别则会高达数千个,且由于汉字的结构偏旁较为复杂,要将这些字符都准确识别出来会使难度系数直线上升。一个典型的OCR技术处理流程如下图所示:

图:来源于网络

其中,图像预处理通常为能使图像中的文字更明显便于识别,会对图像的成像问题进行修正,通常是基于数字图像处理和传统机器学习等方法对图像进行操作。

常见的图像预处理包括几何变换(透视、翻转、旋转、扭曲、拉直等)、畸变矫正、去模糊、锐化、图像增强、光线矫正、灰度化、二值化等。其中,在对付验证码时常用的灰度化、二值化处理对于内容较为简单的文本信息有增强作用,但对复杂背景的内容处理效果就会收效甚微。

文字检测,顾名思义是对图片中存在的文字内容进行检测,检测内容包括文本所在的位置、范围、布局、数量等,通常也包括整体版面分析和文字行检测等。部分OCR软件为了保证检测范围的准确性,还会套用图像检测的方法,对图像中的文本区域进行框选,并像下图所示将框选与待识别区域交由令用户进行校验确认。

图:某OCR软件识别界面

文本检测完成后,建立在其基础之上的文本识别将会对选定的文本内容进行识别,并将图像中的字符转化为可供人类和计算机识别的文本信息。文本信息主要需要解决的问题是每个字符是什么。

对于识别后输出的文本通常需要再次核对验证以确保其准确率,即文本校正,通常也被认为属于文字检测的环节。当识别的内容是由词库中的词汇构成时就称之为有词典识别,反之则称为无词典识别。在整个处理流程过程中,对识别准确率影响最大的步骤就是文本检测与文本识别。相比一般文本,通常对OCR技术的评测会从最终识别率、识别速度、版面理解正确率、版面还原满意度4方面来作为依据。

OCR识别技术对于手写体识别目前尚在发展阶段,而对于印刷体识别的技术已经发展的较为纯熟。而且,对于印刷体识别的应用划分可能远比你我想象的更为细致。例如用于对人身份进行核查验证的证件OCR识别、用于移动支付绑卡的银行卡OCR识别、用于存储管理名片的名片OCR识别、用于大量文字资料、档案卷宗的录入和处理的文档OCR识别、用于银行、金融、电信机构的票据OCR识别、用于交通安全的车辆OCR识别等。

OCR技术的出现无疑提升了工作效率,也改变了我们的生活。

参考文献:

https://www.sohu.com/a/233167039_205239

https://zhuanlan.zhihu.com/p/45376274

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • OCR
    OCR
    +关注

    关注

    0

    文章

    176

    浏览量

    17273

原文标题:文字识别界的“拍立得”——OCR识别技术

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工业级OCR手持终端怎么选?国产OCR智能识别pda实测

    工业环境专用OCR智能PDA怎么选?鸟鸟科技N70Socr具备IP67防尘防水+1.5米抗跌落,5000mAh可拆卸电池支持24小时轮班作业。专业OCR扫描头+斑马/霍尼二维码引擎双模组,285g人体工学设计,让高强度数据采集更轻松。点击查看详细防护测试与续航实测数据!
    的头像 发表于 02-07 17:45 456次阅读
    工业级<b class='flag-5'>OCR</b>手持终端怎么选?国产<b class='flag-5'>OCR</b>智能<b class='flag-5'>识别</b>pda实测

    友思特案例 | 金属行业视觉检测案例四:挖掘机钢板表面光学字符识别OCR)检测

    在挖掘机钢板表面光学字符识别OCR)检测中,通过实施友思特深度学习视觉检测解决方案,解决了挖掘机零部件生产所用钢板上标记识别的问题。这有助于防止材料分配错误,显著提高了生产效率。
    的头像 发表于 02-05 11:40 340次阅读
    友思特案例 | 金属行业视觉检测案例四:挖掘机钢板表面光学字符<b class='flag-5'>识别</b>(<b class='flag-5'>OCR</b>)检测

    DeepX OCR:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 与 x86 平台交付可规模化的高性能 OCR 能力

    一、行业背景与核心挑战:OCR 规模化应用的关键瓶颈 **随着文档识别技术的不断成熟,OCR 技术已从实验性阶段逐步走向实际业务场景,在政务
    的头像 发表于 01-22 21:02 304次阅读
    DeepX <b class='flag-5'>OCR</b>:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 与 x86 平台交付可规模化的高性能 <b class='flag-5'>OCR</b> 能力

    瑞芯微(EASY EAI)RV1126B OCR文字识别

    1.OCR文字识别简介文字识别也是图像领域一个常见问题。然而,对于自然场景图像,首先要定位图像中的文字位置,然后才能进行文字的识别。所以一般包含两个步骤:文字检测:解决的问题是哪里有文
    的头像 发表于 01-12 10:19 6932次阅读
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>OCR</b>文字<b class='flag-5'>识别</b>

    识别身份证和护照OCR识别的手持终端设备

    鸟鸟科技N70S身份证护照识别手持终端设备,集成身份证、护照OCR识别及生物核验功能,工业级IP67三防设计+高性能配置,支持多场景移动办公,续航持久、扫码精准,是执法、海关、医疗等行业提升身份核验效率的优选神器。
    的头像 发表于 01-06 11:57 397次阅读
    能<b class='flag-5'>识别</b>身份证和护照<b class='flag-5'>OCR</b><b class='flag-5'>识别</b>的手持终端设备

    【嘉楠堪智K230开发板试用体验】+OCR实现

    OCR OCR(Optical Character Recognition,光学字符识别)是一种将图像中的文字内容转换为可编辑、可搜索文本的技术。其核心在于通过图像预处理、字符分割、特
    发表于 08-23 18:53

    如何利用OCR技术实现高效集装箱箱号识别

    在现代物流和海关监管领域,快速准确地识别集装箱箱号是提升通关效率、降低运营成本的关键。OCR(光学字符识别技术的应用,为这一需求提供了智能化解决方案。通过结合高清成像设备和先进的算法
    的头像 发表于 08-12 10:48 978次阅读
    如何利用<b class='flag-5'>OCR</b><b class='flag-5'>技术</b>实现高效集装箱箱号<b class='flag-5'>识别</b>?

    ocr识别时数据集上传压缩包,上传成功,但不显示图片,图片数量仍显示0,为什么?

    ocr识别时数据集上传压缩包,上传成功,但不显示图片,图片数量仍显示0
    发表于 07-23 08:11

    端侧OCR文字识别实现 -- Core Vision Kit ##HarmonyOS SDK AI##

    获取图片url,把这个url和token再发给百度的ocr接口获取识别数据……或者图片转base64以后把这个base64发给接口,然而鸿蒙这里,目前我也不知道啥原因(可能是发送请求的数据长度有限
    发表于 06-30 18:07

    OCR技术如何实现铁路集装箱号的自动识别

    在铁路物流运输中,集装箱号的快速准确识别是提升效率的关键环节。通过先进的OCR(光学字符识别技术,结合计算机视觉与深度学习方法,可以实现铁路集装箱号的高效、可靠
    的头像 发表于 06-13 10:32 751次阅读

    OCR技术vs传统识别:哪种更适合火车集装箱识别

    在铁路物流领域,集装箱箱号识别是提升运输效率的关键环节。随着计算机视觉技术的发展,OCR识别与传统识别
    的头像 发表于 06-11 10:54 742次阅读

    明治案例 | 150个/分钟!电阻【OCR识别】+【尺寸测量】一步到位

    真实案例——看明治传感如何用一个视觉传感器,同时搞定电阻的尺寸测量和OCR识别,让质检效率翻倍,成本直降!场景需求希望在同一工位完成尺寸测量与OCR识别,减少设备占
    的头像 发表于 06-10 07:33 899次阅读
    明治案例 | 150个/分钟!电阻【<b class='flag-5'>OCR</b><b class='flag-5'>识别</b>】+【尺寸测量】一步到位

    集装箱箱号识别手持终端的核心技术解析

    在现代港口物流智能化领域,集装箱箱号识别手持终端已成为提升作业效率的关键设备。这类设备集成了多项前沿技术,为行业提供了高效、精准的移动识别解决方案。本文将深入解析其核心技术优势。 一、
    的头像 发表于 06-05 10:13 688次阅读

    OCR识别训练完成后给的是空压缩包,为什么?

    OCR识别 一共弄了26张图片,都标注好了,点击开始训练,显示训练成功了,也将压缩包发到邮箱了,下载下来后,压缩包里面是空的 OCR图片20几张图太少了。麻烦您多添加点,参考我们的ocr
    发表于 05-28 06:46