OCR (光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。
ocr识别的过程如下:
1、图像输入:要进行ocr识别,第一步便要采集所要识别的图像,可以是名片、身份证、护照、行驶证、驾驶证、公文、文档等等都可以,然后将图像输入到识别核心。
2、图像预处理:此过程包含二值化(将图像上的像素点灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果)、去噪、倾斜度矫正等。
3、版面分析:将所要识别的文档分段、分行处理
4、字符切割:此时需要字符定位和字符切割,定位出字符串的边界,然后分别对字符串进行单个切割,单个分割出来的字符再做识别。
5、字符特征提取:提取字符特征,为后面的识别提供依据。
6、字符识别:将当前字符提取的特征向量与特征模板库进行模板粗分类和模板细匹配,识别出字符。
7、版面回复:将识别结果按照原来的版面排班,输出Word或pdf格式的文档。
8、后处理校正: 根据特定的语言上下文的关系,对识别结果进行较正的算法。
-
字符识别
+关注
关注
0文章
16浏览量
8598 -
OCR
+关注
关注
0文章
140浏览量
16190
发布评论请先 登录
相关推荐
AOI字符识别机器视觉系统方案
![AOI<b class='flag-5'>字符识别</b>机器视觉系统方案](https://file1.elecfans.com/web2/M00/E7/0D/wKgaomZGNPmAEFTOAAY_FhHQbkM506.png)
项目分享|基于ELF 1开发板的车牌识别系统
![项目分享|基于ELF 1开发板的车牌<b class='flag-5'>识别</b>系统](https://file1.elecfans.com/web2/M00/C4/D2/wKgaomXvrjyAHcj5AAA_mYyGqvs523.png)
EVS深度学习智能相机OCR工具性能大揭秘
![EVS深度学习智能相机<b class='flag-5'>OCR</b>工具性能大揭秘](https://file.elecfans.com/web2/M00/02/C4/pYYBAGDSzfeAP86XAAAO5PbqJbI698.png)
基于OpenVINO™ 打造一站式光学字符识别 & 检测大师(OCR-Master)
![基于OpenVINO™ 打造一站式<b class='flag-5'>光学</b><b class='flag-5'>字符识别</b> & 检测大师(<b class='flag-5'>OCR</b>-Master)](https://file1.elecfans.com/web2/M00/AC/60/wKgaomVEshyARjprAAAixECeZhs507.png)
可以提取图像文本的5大Python库
![可以提取图像文本的5大Python库](https://file1.elecfans.com/web2/M00/AB/41/wKgaomU_FfGABRFNAAADgvXMnuk557.png)
【KV260视觉入门套件试用体验】Vitis AI Library体验之OCR识别
【KV260视觉入门套件试用体验】七、VITis AI字符和文本检测(OCR&Textmountain)
Tesseract的进阶用法和最佳实践
在线研讨会 | 就在明天!NVIDIA TAO Toolkit 5.0 助力 OCR 视觉 AI 模型快速训练与优化
![在线研讨会 | 就在明天!NVIDIA TAO Toolkit 5.0 助力 <b class='flag-5'>OCR</b> 视觉 AI 模型快速训练与优化](https://file1.elecfans.com/web2/M00/A1/72/wKgaomTpxhiAbjCgAAB0jkXe0UQ517.png)
使用OpenCV技术的车牌识别案例设计
一个典型的身份证识别算法流程
![一个典型的身份证<b class='flag-5'>识别</b>算法流程](https://file1.elecfans.com/web2/M00/8C/0C/wKgaomSk6M6AUH8pAAAPElS4Hpw225.png)
评论