文档库 最新最全的文档下载
当前位置:文档库 › 手写数字识别浅析

手写数字识别浅析

科技信息2008年第28期

SCIENCE &TECHNO LO GY INFORMATION ●

1.概述

手写数字识别(Handwritten Num eral Recog nition)是光学字符识别技术(Optical Character Recog nitio n,简称OC R)的一个分支,它研究的对象是:如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。在整个OCR 领域中,最为困难的就是脱机手写字符的识别。到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距实用还有一定距离。而在手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方案。

字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字、英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。

2.手写数字识别的分类

按识别的对象来分:手写印刷体数字的识别、自由手写数字的识别。

按识别系统运行方式分类:联机手写数字的识别、脱机手写数字的识别。

从识别技术的难度来说,手写体识别的难度高于印刷体识别,而在手写体识别中,脱机手写体的难度又远远超过了联机手写体识别。到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。

3.手写数字识别过程的基本步骤

手写数字的识别过程主要是将要识别的数字图像的特征向量输入已经定义好的网络结构中,通过已经保存的各级网络的权值(即数字模板的相关信息)来计算出输入特征的数据结果,将此计算结果和标准的数字类别比较,即可识别出相应数字的归类。

其基本识别步骤如下:

(1)对所要识别的数字图像进行必要的预处理。预处理包括:数字外界矩形图像的获取,图像噪声的去除,图像的二值化处理,图像的相对位置校正,图像大小的校正,图像数字笔划粗细的调整等。

图像的二值化处理:

将图像中的数字目标通过二值化从图像中提取出来。对于数字识别,可以使用常用的二值化方法来实现。具体阈值的选取取决于具体的图像像素情况,一般情况选取区域像素的平均值。

图像噪声的去除:

取出图像数字周围的一些孤立点和噪声信号,并对图像笔划中的不规则笔划进行校正。在二值化的图像中可能有一些图像笔划的凸凹现象,对于此类现象,可以通过数学形态学中的一些基本运算,选取适当的结构元素去除笔划的凹凸现象和数字周围的一些孤立点。

图像位置的校正:对于各种情况下的图像数字,图像的校正包括:图像位置的校正,图像大小的校正。

图像位置的调整主要是指将数字的角度位置偏差和位移偏差消除掉。

图像大小的校正是指调整图像中的数字大小,使其成为大小统一的图像数字,即对图像的大小做归一化处理,可以使用线性插值来实现。

书写的倾斜程度:

人们在手写数字时往往带有不同的倾斜角度,如果不进行倾斜矫正,同一字形在不同倾斜角度下的图像将体现为不同的模板,势必加

大训练负担,降低识别率。

为了减弱这个因素的影响,可采用一种简单的倾斜矫正来实现,其思路是使矫正后字的上端与下端水平位置对齐。实验表明,这是一种行之有效的方法。

(2)特征提取;

对所要识别的数字图像预处理后的图像进行特征提取,不同的识别算法有不同的特征提取方法。

可用于图像数字特征识别的主要方法有:

图像的子区域像素特征识别:将数字图像进行各种预处理后的单一像素数字图像分成许多小的区域,统计每个子区域中的目标像素个数,由每个子区域的目标像素个数组成一个特征向量,将此特征向量作为图像数字识别的特征来识别数字。此种方法还可以根据形态学中的Hit-M iss Transform 变换对于图像数字的各子区域内的像素相对目标像素和背景像素同时进行匹配来提高此算法的识别率。

基于图像像素圆周特征的识别:此特征提取的思路为将传统的矩形区域的特征向量转换为圆周向量,即求出图像数字以其灰度重心为中心的圆周直方图,以此圆周直方图为特征向量来识别所要识别的数字。

其基本原理如下:

对于图像数字作完各种预处理后,图像的大小、图像的位置、数字笔划的粗细基本上为标准的,所以图像数字的目标像素相对于图像外界矩形的水平和垂直一阶矩而言,以及对于目标像素已归一化的图像而言,其灰度重心是固定,而各图像数字的轮廓相对于其重心的距离(欧氏距离、棋盘距离、城市距离等)也是一定的。由其沿圆周方向的角度与重心的距离组成特征向量,以此特征向量作为标准来识别数字的归类。

基于图像像素的圆周特征向量的匹配算法,可以用于自由手写体的识别上。因为无论对于所要识别的字体是何种模式,在做必要的预处理后,其基于外界矩形的灰度重心与图像数字的写法无关,而其轮廓恰好描述了图像数字的结构特征,所以通过其在360度上的距离直方图与标准数字的圆周直方图比较即可识别其所属的类别。

4.总结

本文浅析了手写数字识别这一具有重大现实意义的识别技术,介绍了手写数字识别的分类,概述了手写数字识别过程的基本步骤,其中特征提取主要介绍了图像的子区域像素特征识别和基于图像像素圆周特征的识别两种方法。【

参考文献】[1]崔屹.图像处理与分析———数学形态学方法及应用[M ].北京:科学出版社,2002.

[2]张宏林.数字图像模式识别技术及工程实践[M].北京:人民邮电出版社,2002.

作者简介:程晨,1977年生,江苏南通人。1996年9月至2000年6月,北京航空航天大学机械工程及自动化学院本科;2000年9月至2003年3月,北京航空航天大学机械工程及自动化学院硕士;2003年4月至今,南通大学计算机学院讲师。

[责任编辑韩铭]

手写数字识别浅析

程晨

(南通大学计算机科学与技术学院

江苏

南通

226019)

【摘要】手写数字的识别研究有着重大的现实意义,本文先对手写数字识别技术进行概述,然后介绍了手写数字识别的分类和基本步骤,最后对全文进行了总结。

关键词】手写数字识别;光学字符识别;数字图像预处理;数字图像特征选取○I T 技术论坛○6:2

相关文档
相关文档 最新文档