OCR简称Optical Character Recognition,它是指对于纸上的打印的文字字符进行识别,将识别结果以文本方式存储在计算机器中。根据识别的字符类型通常可分为印刷体识别和手写体识别两大类。
字符识别原理:通过对特征点形状的提取,分离器分离字符,然后进行文本的输出。
我们以手写字体为例进行讲解,识别的步骤如下:
1.打开机器视觉软件。
2.采集图像。点击软件界面“工具箱”-->“图像处理”-->“采集图像”,将采集图像工具拖至流程栏,如图一所示。采集图像的方式有文件、目录、相机三种方式,我们选择“文件”下采集,如图二所示。在电脑的文件夹中,选择格式为JPG或BMP格式的图片。
图一
图二
3.字符识别工具添加。添加“字符读取”和“字符集合”工具至流程栏,如图三所示
字符读取:用于读取字符文本,需要将标准的字符录入字符集合中。
字符集合:配合“字符读取”工具使用,用于存储字库模板。
图三
4.选择输入图像。点击流程栏的“字符读取”,选择输入的图像为“Task.1采集图像”。如图四所示。
图四
5.设置检测区域。在区域设置中,选择矩形方框,拖动到检测的字符区域,如图五所示。
图五
6.衔接“字符集合”,参数设置。进行分割参数设置(阈值、字符极性、字符宽度、字符 高度)和识别参数设置(最小分数设置)。如图六所示。
图六
通过调整参数来达到将字符逐个分割,如图七所示。
图七
7.学习字符。如图八所示,选择单个学习或全部学习,如图久所示,将图像中的字符逐个输入在学习字符的对话框内,然后“执行”。
图八
图九
8.结果显示。将“系统工具”下的“数据显示”,将拖至流程栏,点击“数据显示”,添加数据文本为“字符读取”的文本,点击确定。
图十
最终的识别结果如下图所示。
以上为手写字符识别的全部过程,由于手写字体具有随机性、自由化程度高,识别起来比印刷字符困难,因此需要大量的学习才能达到快速正确的识别。
总结:
字符识别流程如下图所示
-
分离器
+关注
关注
1文章
82浏览量
15114 -
机器视觉
+关注
关注
163文章
4440浏览量
121191
原文标题:机器视觉知识--手写字体竟然是这样识别的?
文章出处:【微信号:GKB1508,微信公众号:工控帮】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
基于矢量特征编码的手写字符识别技术
基于流形学习与SVM的手写字符识别方法
多样变换的手写验证码自动识别算法
一种改进的仿射传播聚类的手写字符识别

评论