基于matlab的文字识别算法 - 全文

前言

从图像中提取文字属于信息智能化处理的前沿课题，是当前人工智能与模式识别领域中的研究热点。由于文字具有高级语义特征，对图片内容的理解、索引、检索具有重要作用，因此，研究图片文字提取具有重要的实际意义。又由于静态图像文字提取是动态图像文字提取的基础，故着重介绍了静态图像文字提取技术。

随着计算机科学的飞速发展，以图像为主的多媒体信息迅速成为重要的信息传递媒介，在图像中，文字信息（如新闻标题等字幕）包含了丰富的高层语义信息，提取出这些文字，对于图像高层语义的理解、索引和检索非常有帮助。

图像文字提取又分为动态图像文字提取和静态图像文字提取两种，其中，静态图像文字提取是动态图像文字提取的基础，其应用范围更为广泛，对它的研究具有基础性，所以本文主要讨论静态图像的文字提取技术。静态图像中的文字可分成两大类：一种是图像中场景本身包含的文字，称为场景文字；另一种是图像后期制作中加入的文字，称为人工文字，如右图所示。场景文字由于其出现的位置、小、颜色和形态的随机性，一般难于检测和提取；而人工文字则字体较规范、大小有一定的限度且易辨认，颜色为单色，相对与前者更易被检测和提取，又因其对图像内容起到说明总结的作用，故适合用来做图像的索引和检索关键字。对图像中场景文字的研究难度大，目前这方面的研究成果与文献也不是很丰富，本文主要讨论图像中人工文字提取技术。

静态图像中文字的特点

静态图像中文字（本文特指人工文字，下同）具有以下主要特征：

（1）文字位于前端，且不会被遮挡；

（2）文字一般是单色的；

（3）文字大小在一幅图片中固定，并且宽度和高度大体相同，从满足人眼视觉感受的角度来说，图像中文字的尺寸既不会过大也不会过小；

（4）文字的分布比较集中；

（5）文字的排列一般为水平方向或垂直方向；

（6）多行文字之间，以及单行内各个字之间存在不同于文字区域的空隙。在静态图片文字的检测与提取过程中，一般情况下都是依据上述特征进行处理的。

数字图象处理

静态图像文字提取一般分为以下步骤：文字区域检测与定位、文字分割与文字提取、文字后处理。其流程如图所示。

基于matlab的文字识别算法

文字提取、识别的详细步骤

1. 在Matlab中调用i1=imread（‘字符.jpg’），可得到原始图像，如图所示：

2. 调用i2=rgb2gray（i1），则得到了灰度图像，如图所示：

调用a=size（i1）;b=size（i2）;可得到：a=3，b=2 即三维图像变成了二维灰度图像

3. 调用i3=（i2》=thresh）;其中thresh为门限，

图基于matlab的文字识别算法之间这里，

得到二值图像，如图所示：

基于matlab的文字识别算法

4. 把二值图像放大观察，可看到离散的黑点对其采用腐蚀膨胀处理，得到处理后的图像，如图所示

基于matlab的文字识别算法

可见，腐蚀膨胀处理后的图像质量有了很大的改观。横向、纵向分别的腐蚀膨胀运算比横向、纵向同时的腐蚀膨胀运算好上很多，图6可看出差别：

基于matlab的文字识别算法

5、对腐蚀膨胀后的图像进行Y方向上的区域选定，限定区域后的图像如图所示：扫描方法：中间往两边扫

基于matlab的文字识别算法

纵向扫描后的图像与原图像的对照，如图8所示：

基于matlab的文字识别算法

6、对腐蚀膨胀后的图像进行X方向上的区域选定，限定区域后的图像如图9所示：扫描方法：两边往中间扫

基于matlab的文字识别算法

纵向扫描后的图像与原图像的对照，如图所示：

基于matlab的文字识别算法

7. 调用i8=（iiXY~=1），使背景为黑色（0），字符为白色（1），便于后期处理。背景交换后的图像如图11所示：

8. 调用自定义函数（字符获取函数）i9=getchar（i8），得到图像如图所示：

9、调用自定义的字符获取函数对图像进行字符切割，并把切割的字符装入一维阵列，切割过程如图12所示：

10.调用以下代码，可将阵列word中的字符显示出来，如图13所示：

for j=1:cnum %cnum为统计的字符个数

subplot（5，8，j），imshow（word{j}），title（int2str（j））; %显示字符

end

可以看到，字符宽度不一致

11. 调用以下代码，将字符规格化，便于识别： for j=1:cnum word{j}=imresize（word{j}，［40 40］）; %字符规格化成40×40的 end 得到规格化之后的字符如图14所示：

12. 调用以下代码创建字符集：

code=char（‘由于作者水平有限书中难免存在缺点和疏漏之处恳请读批评指正，。’）;

将创建的字符集保存在一个文件夹里面，以供匹配时候调用，如图15所示：

13. 字符匹配采用模板匹配算法：将现有字符逐个与模板字符相减，认为相减误差最小的现有字符与该模板字符匹配。

基于matlab的文字识别算法

也就是说，字符A与模板字符T1更相似，我们可以认为字符集中的字符T2就是字符A。经模板匹配，可得字符信息如下：由于读者书评有限书中难免存在缺点和纰漏之处，恳请读者批评指正。效果如图16所示：

基于matlab的文字识别算法

14、调用以下代码，将字符放入newtxt.txt文本：

new=［‘newtxt’，‘.txt’］; c=fopen（new，‘a+’）; fprintf（c，‘%s ’，Code（1:cnum））; fclose（c）; newtxt.txt文本内容如图17所示：

基于matlab的文字识别算法

总结

1、算法具有局限性。对于左右结构的字符（如：川）容易造成误识别，“川”字将会被识别成三部分。当图片中文字有一定倾斜角度时，这将造成识别困难。

2、模板匹配效率低。对于处理大小为m×m的字符，假设有n个模板字符，则识别一个字符至

少需要m×m×n×2次运算，由于汉字有近万个，这将使得运算量十分巨大！此次字符识别一共花了2.838秒。

3、伸缩范围比较小。对于受污染的图片，转换成二值图像将使字符与污染源混合在一起。

对于具体的图片，需反复选择合适的thresh进行二值化处理，甚至在处理之前必须进行各种滤波。

阅读全文

上一页 1 2全文

本文导航

第 1 页：基于matlab的文字识别算法
第 2 页：文字提取、识别的详细步骤（二）

matlab(227703) matlab(227703)

OpenVINO场景文字检测与文字识别教程

OpenVINO是英特尔推出的深度学习模型部署框架，当前最新版本是OpenVINO2023版本。OpenVINO2023自带各种常见视觉任务支持的预训练模型库Model Zoo，其中支持场景文字检测

2023-09-24 15:31:00

209

使用LabVIEW 实现物体识别、图像分割、文字识别、人脸识别等深度视觉

LabVIEW可以实现深度学习嘛，今天我们一起来看看使用LabVIEW 实现物体识别、图像分割、文字识别、人脸识别等深度视觉

2023-08-11 16:02:21

326

人脸识别的算法有哪些

人脸识别的算法有哪些人脸识别算法现在已经广泛应用于各个领域，如安防、商业、医疗等。人脸识别算法可以分为传统人脸识别算法和深度学习人脸识别算法。传统人脸识别算法包括以下几种： 1. 特征提取算法

2023-08-09 18:34:09

743

图片文字识别：揭开数字世界的神秘面纱

随着数字化时代的到来，我们生活中的大部分数据都以图片的形式存在。然而，这些图片中蕴含的信息往往比文字更丰富，如何从这些图片中提取有价值的信息，是数字世界中一个十分重要的问题。这时，图片文字识别技术

2023-05-11 18:20:04

234

模糊数学matlab

模糊数学matlab模糊数学+变分法+Matlab基础教程.doc  模式识别及识别的直接方法在日常生活中生活中，经常需要进行各种判断、预测。如图象文字识别、故障（疾病）的诊断

2008-06-18 13:36:26

Matlab航迹规划仿真—A*算法

Matlab航迹规划仿真—A*算法

2022-11-14 10:54:39

749

基于MATLAB的遗传算法

基于MATLAB的遗传算法程序分享

2022-09-30 14:28:28

MATLAB优化算法汇总03

MATLAB优化算法汇总03

2021-10-08 11:01:09

MATLAB优化算法汇总02

MATLAB优化算法汇总02

2021-10-08 10:59:39

MATLAB优化算法汇总01

MATLAB优化算法汇总01

2021-10-08 10:57:12

流形学习LLE算法的配套Matlab源码汇总

流形学习LLE算法的配套Matlab源码汇总

2021-08-25 09:30:43

浅析HarmonyOS基于AI的通用文字识别技术

在资讯大爆炸的时代，我们经常面临文件、图片找不到的情况，HarmonyOS基于AI的通用文字识别技术，可以有效帮助我们解决这些难题。基于AI的通用文字识别，将OCR技术和AI分词技术集成，可以

2021-08-20 10:42:26

2662

非线性整数规划的遗传算法及MATLAB程序下载

非线性整数规划的遗传算法及MATLAB程序下载

2021-06-15 10:55:24

使用Matlab算法集合用于数字信号处理的应用

使用Matlab算法集合用于数字信号处理的应用说明。

2021-05-27 09:34:34

Matlab的模式识别和计算智力使用技巧

Matlab的模式识别和计算智力使用技巧说明。

2021-05-27 09:21:30

基于MATLAB的车牌识别系统

基于MATLAB的车牌识别系统设计说明。

2021-04-16 09:30:42

计算机文字识别技术研究

计算机文字识别技术研究。

2021-03-24 14:15:39

OCR文字识别视觉检测系统应用程序免费下载

本文档的主要内容详细介绍的是OCR文字识别视觉检测系统应用程序免费下载。

2020-05-28 17:31:00

怎样简单识别图片文字转换到Word

　　工作中我们经常会处理到各种各样的图片文件，有时候还需要将图片文件上的信息整理到Word一类的文档中，这样编辑起来就很方便，那怎样简单识别图片文字转换到Word呢？下面我们就一起来来看下吧

2019-03-27 13:50:47

533

怎样简单识别提取图中文字

分享一种简单识别提取图中文字的方法，问题就可以轻松解决了。　　参考工具：迅捷OCR文字识别软件　　操作步骤：　　1：因为接下来使用到的是PC端的工具，所以整个步骤都是在电脑中进行的，将OCR文字识别软件

2019-03-26 14:41:15

704

如何使用MATLAB进行语音识别算法研究的论文资料免费下载

算法： DTW算法、VQ算法和HMM算法。并且在MATLAB环境中提取了孤立字语音（十个数字0~9的汉语发音）的LPCC、MFCC特征参数，用它们配合上述3种语音识别算法实现了对这些孤立字语音的识别。

2018-12-21 15:03:31

基于sopc嵌入式文字识别系统设计

设计了一种基于SoPC的嵌入式文字识别系统。在FPGA平台下，基于SoPC框架搭建软硬件协同系统，设计硬件电路完成文字图像的采集和预处理，嵌入Linux系统，使用其下的识别引擎完成文字图像的识别

2018-12-19 11:43:58

1115

如何在电脑中对图片文字进行局部识别

相信很多人和小编一样电脑中保存了一些带有文字的图片，有时候因为需要会将里面的文字进行提取，然而又不想对着图片一个字一个字的打出来，这个时候就需要对图片中的文字进行局部识别了，那要怎样去操作呢

2018-11-13 14:07:12

354

如何提取和检测视频中的文字？数字视频中文字的检测提取技术的分析

的检测与分割以及视频文字识别（Video OCR）等。对于不同的典型算法，分析了其理论基础和应用特点，并且通过对比指出其不足和应用的局限。最后，本文还展望了该技术未来发展的方向。

2018-09-17 17:58:00

Matlab教程之Matlab安装教程和如何使用Matlab生成DSP C6748可用的算法

Matlab 作为最常见的数学软件，具有便捷的开发及仿真功能。使用 Matlab 编写算法，并将算法生成可以用于 DSP C6748 的 C/C++代码，将大大减轻 DSP 算法开发难度。

2018-09-14 10:53:00

Matlab关于Apriori算法设计

本文详细介绍了Matlab关于Apriori算法设计。Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法Apriori使用一种称作逐层搜索的迭代方法，“K-1项集”用于搜索“K项集”。

2018-02-02 16:20:15

4662

蚁群算法matlab程序代码

本文详细解析了关于蚁群算法matlab程序代码，具体步骤请看下文。

2018-02-02 10:21:21

37152

基于FPGA的OCR文字识别技术的深度解析

OCR在通用文字识别等场景下有广泛应用，基于FPGA异构加速的OCR识别相比CPU/GPU实现具有延时小、成本低的优势。我们设计了多FPGA芯片协同的异构加速架构，能快速适配业务OCR模型变化，检测

2018-01-26 12:19:00

3457

BP算法及其matlab实现

高级自动控制算法：BP算法及其matlab实现

2017-12-02 11:45:47

基于matlab的车牌识别技术_冀光强

基于matlab的车牌识别技术_冀光强

2017-03-18 09:18:05

Android文字识别

2016-12-20 22:40:34

使用Matlab生成可供DSPC6748使用的算法

使用 Matlab 生成可供 DSP C6748 使用的算法

2016-11-14 17:33:11

基于MATLAB的遗传算法的源程序

基于MATLAB的遗传算法的源程序，下来看看

2016-07-20 16:51:51

车牌识别-matlab

完整的车牌识别MATLAB源代码，车牌定位，区域切割，字符切割，字符识别

2016-06-16 17:57:46

Matlab语言常用算法程序集

Matlab语言常用算法程序集，又需要的下来看看。

2016-05-19 14:31:12

MATLAB车牌识别过程

MATLAB车牌识别技术外加源程序，试过可以实现该功能。

2016-05-13 15:51:21

MATLAB数学建模算法及实例分析

MATLAB数学建模算法及实例分析，了解MATLAB

2016-01-22 14:06:50

指纹识别matlab源代码

指纹识别matlab源代码，利用matlab实现指纹识别的算法

2016-01-20 15:53:35

算法大全__Matlab在线性代数中的应用

算法大全__Matlab在线性代数中的应用。

2016-01-14 17:56:24

基于MATLAB的指纹识别系统

基于MATLAB的指纹识别系统有需要的下来看看

2015-12-29 17:25:29

PID算法Matlab仿真程序和C程序

PID算法Matlab仿真程序和C程序有需要的看一看，不收积分。

2015-11-20 17:06:14

模糊推理的Mamdani算法及其Matlab实现

模糊滤波的mamdani算法及其Matlab实现

2015-11-17 18:23:01