资料介绍
0 前言
随着智能手机和平板电脑等无输入键盘电子设备的流行,联机手写识别的研究吸引了越来越多的关注。而手写签名验证和基于3D加速度传感器的姿态识别、手写识别等新应用形式的出现,也为联机手写识别的研究注入了新的活力。
支持向量机(Support Vector Machine,SVM)是在统计学习理论的基础上发展起来的新一代分类识别算法,使用核函数方法将非线性可分的特征向量映射到高维空间,计算最大化分类间隔的最优分类超平面。在文本分类、语音识别、手写识别、曲线拟合等领域,SVM已经有比较成熟的应用。但是,一般的核函数要求不同样本的特征向量的维数相同,限制了SVM在语音识别和联机手写识别领域的进一步发展。为此,Bahlmann等人使用弹性距离计算算法--DTW算法--构造了GDTW核函数,进而提出GDTW-SVM算法。GDTW-SVM的联机手写识别实验结果表明,GDT W-SVM取得了可媲美隐马尔科夫模型、神经网络等分类算法的识别率,并且与使用后来提出的基于其它弹性距离计算构造的核函数的SVM相比,性能不相伯仲。
本文结合GDTW核函数和联机手写识别样本的特征向量的特点,引入新的控制参数优化GDTW核函数的计算。实验结果表明,本文提出的优化方法不仅减少了支持向量的数目,而且提高了GDTW-SVM运行效率。
1 联机手写识别过程
1.1 联机手写识别流程介绍
联机手写识别的过程与通用模式识别的过程基本相同,由数据采集和预处理、特征提取、分类识别、后处理四个步骤组成。
在数据采集和预处理阶段,首先使用传感器采集原始物理信息,比较常见的是加速度、速度、位移、起笔和落笔;然后,对原始信息进行传感器矫正、去噪等预处理。
特征提取是手写识别的重要步骤之一,对分类器的设计和分类结果有着重要的影响,选择合适的特征不仅可以提高识别率,也可以节省计算存储空间、运算时间、特征提取费用。联机手写识别中比较常见特征提取方法有加速度、位移、DCT变换等。
分类识别是手写识别的核心阶段,大多数分类器在实际分类应用之前,需要使用训练样本对分类器进行训练,不断地修正特征提取方法和方案、分类器的判决规则和参数。目前,分类识别的训练阶段需要人工干预以达到最佳的识别率。
一些识别系统在分类识别之后使用后处理进一步提高识别率。例如,数字“1”和小写字母“1”在很多情况下难以分辨,但是在后处理阶段结合上下文信息,决定当前字符是数字“1”还是小写字母“1”。
1.2 联机手写识别实验
本文联机手写识别实验采用了Bahlmann等人和Bothe等人使用的方法。所使用的样本数据库是免费的联机手写数据库UJIpenchars2。它采用Toshiba M400 Tablet PC收集,包含60个书写者的共11640个手写样本。这些样本包含ASCII字符、拉丁字符和西班牙字符,而每个字符包含80个训练样本和140个测试样本。每个样本由一划或多划组成,数据库提供每个笔划的坐标序列。
坐标序列由等时间间隔采集的笔尖的水平坐标xi和垂直坐标yi组成。而在本文实验中,样本的坐标序列不经过任何去噪等预处理,直接对每个坐标点,使用字符的重心(μx,μy)和垂直坐标的方差σy计算列向量
式(1)中,ang是求虚数相角的函数。每个字符样本的特征向量是T=(t1,…,tNT),其中,NT是采集的坐标点数目,即特征向量的维数,每个字符样本的NT可以不相同。
本文的联机手写识别实验假设每个字符不需要分析其上下文即可完成识别,所以,特征提取之后使用本文所述的分类算法进行分类识别,并且将其输出结果作为最终识别结果,不经过任何后处理。
2 GDTW-SVM算法
2.1 支持向量机
假设线性分类器对输入的特征向量x={x1,x2,…xn}(n是样本数目),输出Y={y1,y2,…,yn}其中,xi,I RN,N是特征向量的维数:yi∈{-1,1}, yi=-1表示样本(xi,yi)属于第一类,yi=1表示样本(xi,yi)属于另一类。该线性分类器的分类决策为
y(+b)≥1 (2)
式(2)中(w,b)确定分类超平面+b=0。
SVM以最小化结构风险为目标,计算使得训练样本集到分类超平面的距离最大化的最优分类超平面。其等价于对式(2)求解凸二次规划问题。
即寻找使平均距离最小的最优对齐路径。DTW距离越小,T和R所代表的样本越相似。可以使用动态规划(Dynamic Programming)算法计算最优对齐路径和DTW距离。
随着智能手机和平板电脑等无输入键盘电子设备的流行,联机手写识别的研究吸引了越来越多的关注。而手写签名验证和基于3D加速度传感器的姿态识别、手写识别等新应用形式的出现,也为联机手写识别的研究注入了新的活力。
支持向量机(Support Vector Machine,SVM)是在统计学习理论的基础上发展起来的新一代分类识别算法,使用核函数方法将非线性可分的特征向量映射到高维空间,计算最大化分类间隔的最优分类超平面。在文本分类、语音识别、手写识别、曲线拟合等领域,SVM已经有比较成熟的应用。但是,一般的核函数要求不同样本的特征向量的维数相同,限制了SVM在语音识别和联机手写识别领域的进一步发展。为此,Bahlmann等人使用弹性距离计算算法--DTW算法--构造了GDTW核函数,进而提出GDTW-SVM算法。GDTW-SVM的联机手写识别实验结果表明,GDT W-SVM取得了可媲美隐马尔科夫模型、神经网络等分类算法的识别率,并且与使用后来提出的基于其它弹性距离计算构造的核函数的SVM相比,性能不相伯仲。
本文结合GDTW核函数和联机手写识别样本的特征向量的特点,引入新的控制参数优化GDTW核函数的计算。实验结果表明,本文提出的优化方法不仅减少了支持向量的数目,而且提高了GDTW-SVM运行效率。
1 联机手写识别过程
1.1 联机手写识别流程介绍
联机手写识别的过程与通用模式识别的过程基本相同,由数据采集和预处理、特征提取、分类识别、后处理四个步骤组成。
在数据采集和预处理阶段,首先使用传感器采集原始物理信息,比较常见的是加速度、速度、位移、起笔和落笔;然后,对原始信息进行传感器矫正、去噪等预处理。
特征提取是手写识别的重要步骤之一,对分类器的设计和分类结果有着重要的影响,选择合适的特征不仅可以提高识别率,也可以节省计算存储空间、运算时间、特征提取费用。联机手写识别中比较常见特征提取方法有加速度、位移、DCT变换等。
分类识别是手写识别的核心阶段,大多数分类器在实际分类应用之前,需要使用训练样本对分类器进行训练,不断地修正特征提取方法和方案、分类器的判决规则和参数。目前,分类识别的训练阶段需要人工干预以达到最佳的识别率。
一些识别系统在分类识别之后使用后处理进一步提高识别率。例如,数字“1”和小写字母“1”在很多情况下难以分辨,但是在后处理阶段结合上下文信息,决定当前字符是数字“1”还是小写字母“1”。
1.2 联机手写识别实验
本文联机手写识别实验采用了Bahlmann等人和Bothe等人使用的方法。所使用的样本数据库是免费的联机手写数据库UJIpenchars2。它采用Toshiba M400 Tablet PC收集,包含60个书写者的共11640个手写样本。这些样本包含ASCII字符、拉丁字符和西班牙字符,而每个字符包含80个训练样本和140个测试样本。每个样本由一划或多划组成,数据库提供每个笔划的坐标序列。
坐标序列由等时间间隔采集的笔尖的水平坐标xi和垂直坐标yi组成。而在本文实验中,样本的坐标序列不经过任何去噪等预处理,直接对每个坐标点,使用字符的重心(μx,μy)和垂直坐标的方差σy计算列向量
式(1)中,ang是求虚数相角的函数。每个字符样本的特征向量是T=(t1,…,tNT),其中,NT是采集的坐标点数目,即特征向量的维数,每个字符样本的NT可以不相同。
本文的联机手写识别实验假设每个字符不需要分析其上下文即可完成识别,所以,特征提取之后使用本文所述的分类算法进行分类识别,并且将其输出结果作为最终识别结果,不经过任何后处理。
2 GDTW-SVM算法
2.1 支持向量机
假设线性分类器对输入的特征向量x={x1,x2,…xn}(n是样本数目),输出Y={y1,y2,…,yn}其中,xi,I RN,N是特征向量的维数:yi∈{-1,1}, yi=-1表示样本(xi,yi)属于第一类,yi=1表示样本(xi,yi)属于另一类。该线性分类器的分类决策为
y(+b)≥1 (2)
式(2)中(w,b)确定分类超平面+b=0。
SVM以最小化结构风险为目标,计算使得训练样本集到分类超平面的距离最大化的最优分类超平面。其等价于对式(2)求解凸二次规划问题。
即寻找使平均距离最小的最优对齐路径。DTW距离越小,T和R所代表的样本越相似。可以使用动态规划(Dynamic Programming)算法计算最优对齐路径和DTW距离。
下载该资料的人也在下载
下载该资料的人还在阅读
更多 >
- 最小内内方差支持向量引导的字典学习算法 7次下载
- 支持向量机网络搜索优化应用程序下载 0次下载
- 支持向量机的手势识别 1次下载
- 模糊支持向量机的改进方法 0次下载
- 基于支持向量机的车牌字符识别_刘连忠 0次下载
- 双目标函数支持向量机在情感分析中的应用 0次下载
- 支持向量机的多组分气体实验 14次下载
- 基于支持向量机的数字调制识别算法 20次下载
- 支持向量机语音识别算法在OMAP5912上的移植
- 基于支持向量机的手势识别研究
- 基于改进支持向量机的货币识别研究
- 基于小波变换与支持向量机的虹膜识别新算法
- 基于ANN和HMM的联机手写体汉字识别系统
- SVM在小字符集手写体汉字识别中的应用研究
- 支持向量机超声缺陷识别法的研究
- 什么是中断向量偏移,为什么要做中断向量偏移? 1300次阅读
- 机器学习相关介绍:支持向量机(低维到高维的映射) 1892次阅读
- 误差向量分析实际的测量与应用 2979次阅读
- 什么是支持向量机 什么是支持向量 2.1w次阅读
- 基于贝塞尔曲线和RNN的手写识别新方法 3887次阅读
- 支持向量机的分类思想 5038次阅读
- 人脸识别闸机的功能及工作原理_视美泰的人脸识别闸机方案分析 1.9w次阅读
- 关于支持向量机(SVMs) 4087次阅读
- 机器学习-8. 支持向量机(SVMs)概述和计算 5105次阅读
- 人脸识别考勤机优缺点分析 2w次阅读
- 人脸识别考勤机的工作原理详解(安装注意事项和使用方法以及优缺点分析) 6w次阅读
- 基于paddlepaddle的mnist手写数字识别的详细分析 6271次阅读
- S Pen手写笔浅析_S Pen手写笔工作原理及发展前景 1.1w次阅读
- 什么是手写绘图板 手写板哪个品牌好价格怎么样 6502次阅读
- 划片机视觉识别系统设计原理分析 2947次阅读
下载排行
本周
- 1TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 2开关电源基础知识
- 5.73 MB | 6次下载 | 免费
- 3100W短波放大电路图
- 0.05 MB | 4次下载 | 3 积分
- 4嵌入式linux-聊天程序设计
- 0.60 MB | 3次下载 | 免费
- 5基于FPGA的光纤通信系统的设计与实现
- 0.61 MB | 2次下载 | 免费
- 6基于FPGA的C8051F单片机开发板设计
- 0.70 MB | 2次下载 | 免费
- 751单片机窗帘控制器仿真程序
- 1.93 MB | 2次下载 | 免费
- 8基于51单片机的RGB调色灯程序仿真
- 0.86 MB | 2次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33564次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21548次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6653次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537796次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420026次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191185次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183278次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多