基于神经网络的手写数字识别系统的设计与实现(3)

来源：网络收集时间：2026-08-02

导读： end end imshow(N) 例如，数字图像“0.bmp”经该归一化算法计算得到矩阵 M，MATLAB 运行结果如图2.4所示。图2.4 归一化处理 2.3.4 细化许多字符识别方法在预处理中都很重视对二值化字符的细化处理。直观来说，细

end

imshow(N)

例如，数字图像“0.bmp”经该归一化算法计算得到矩阵 M，MATLAB 运行结果如图2.4所示。

图2.4 归一化处理

2.3.4 细化

许多字符识别方法在预处理中都很重视对二值化字符的细化处理。直观来说，细化就是将二值化字符点阵逐层剥去轮廓上的点，变成笔画宽度只有一个像素宽度的字符骨架图形。之所以需要细化处理，是因为二值化点阵图形中，对识别有价值

的文字特征信息主要集中在字符骨架上，细化后的字符骨架既保留了原字符的绝大部分的特征，又利于特征提取。细化后骨架的存储量比原来的二值化字符点阵要少得多，降低了处理工作量。

手写体数字细化的基本要求如下：

第一、保持原有字符笔画的连续性，不能由于细化造成笔画断裂。

第二、要细化为单线，即笔画宽度为一个像素。

第三、细化后的骨架应尽量是原来笔画的中心线。

2.4 小结

预处理是手写数字识别中不可缺少的组成部分,对图像预处理的好坏直接影响到识别的结果, 关系到识别算法的好坏。文中首先对待识别数字的预处理进行了介绍，包括平滑去噪、二值化、归一化、细化等图像处理方法，经过这些预处理步骤, 对图像中部分变形信息进行了修正, 消除图像中与识别无关的因素, 而且尽量保持原图像的字符特征, 在实验中提高了数字识别网络的性能。

第三章特征提取

3.1 特征提取的概述

模式识别使用特征来区分不同的种类。因此，特征提取是模式识别系统的关键部分。特征提取的目标是找到某种变换，将N维或N*N维的模式类别空间转换到维数小得多的M维特征空间，并同时保留模式识别所需要的大部分信息。通过特征提取，模式分类可以在维数低得多的空间上进行，从而降低了计算的复杂度。而且，对给定的训练样本进行特征提取可以获得更精确的分类函数的描述，以构造更可靠的分类规则。

同样对于手写体数字的识别，特征提取可以降低字符信息量、去除无用的冗余信息，提高识别系统效率，一直是字符识别领域中的关键点。

特征提取的目的是从原始数据中抽取出用于区分不同类型的本质特征。无论是识别过程还是学习过程，都要对研究对象固有的、本质的重要特征或属性进行量测并将结果数值化，形成特征矢量。

手写体数字的识别中，常用的特征有结构特征和统计特征。结构特征和统计特征各有其优点：结构特征能描述字符的结构，对于不同人书写的字符，形体不同，但结构都是一致的，所以结构特征能克服手写字体因人而引起的畸变；统计特征最大的优点是对环境噪音不敏感，如若字符的背景噪音通常都是呈高斯分布，用统计特征进行识别可对此影响忽略不计。本章将用两小节分别对结构特征和统计特征进行论述。

3.2 统计特征

对复杂图像信号作小波变换[11]，进行多分辨率分析，已经成为图像信号分析和处理的常用方法。由于小波变换的结果体现为大量的小波分解系数，这些系数包含了系统或信号本身大量和多样的特征信息。如果图像信号的主要信息能以一个或一组特征量来表征，我们就可以更加直观、有效和方便地对各种随机信号进行信息提取、信号检测、特征识别。

统计特征分为宏观特征信息和局部特征信息。宏观特征信息是需要在整幅图像上获取的特征信息。传统的全局特征主要包括：全局变换特征（对字符图像进行各种变换，利用变换系数作为特征向量，常用的变换有Fourier变换、K-L变换、小波变换等）、不变矩特征、全局笔划方向特征等；常用的局部统计特征有：局部笔划方向特征、Gabor特征等。统计特征对微小的畸变不敏感，但区分相似的能力较差。

以下为程序设计中对小波分析提取低频部分的统计特征的实例：

f=imread('sample.bmp');输入图像

[c,s]=wavedec2(h,3,'db2');对人脸图像进行3阶小波分解，并提取小波系数

wave2gray(c,s,8);显示小波分解后各子图

y=wavecopy('a',c,s)

figure,imshow(mat2gray(y));提取主要特征

3.3 结构特征

采用结构特征[12]对字符进行结构分析从而达到识别目的，是一种非常直观的方法。字符由各个子部件构成，逐级分析字符图像的结构，根据各元素的属性、数量及其相互关系，便可判定待识字符。与统计方法相比，结构分析不注重特征的绝对位置，只考虑特征的相对关系，因而对书写风格的变化不敏感，其缺点在于特征提取和模板的建立都十分困难，匹配算法也比较复杂，神经网络的应用弥补了这个缺点，只要提取出适当的结构向量作为神经网络的输入向量，会得到令人满意的识别输出结果。以下详细介绍。

3.3.1 结构特征提取

首先对经预处理后的图像进行分割，如图3.1所示。

图3.1 图像分割

对图像分割后，结构特征提取的算法如下：

(1)对细化后的数字图像取竖直的三条直线,分别取在5/12,1/2,7/12处,记下这三条竖直直线与数字笔段的交点数。

(2)再取水平三条直线,分别取在1/3,1/2,2/3处, 分别记下这三条水平直线与数字笔段的交点数。

(3)再取对角两条直线, 分别记下这两条对角直线与数字笔段的交点数。

3.3.2 笔划特征的提取

经细化后的数字图像其特征较为稳定,且笔划简单,因此对其抽取的基本结构组件能反映数字的本质特征,从而可快速有效地识别数字,并达到较好的分类效果。数字端点如图3.2所示。

图3.2数字端点

对图像分割后，结构特征提取的算法如下：

(1)按从上到下,从左到右的顺序扫描预处理后图像并选择黑像素点P；

(2)计算像素P的8－邻域之和N；

(3)若N=1,则像素P为端点,端点计数器加一；

(4)重复步骤(1)-(3),直到遍历整个图像。

3.3.3 数字的特征向量说明

依据上述特征提取方法,本系统中的特征矢量由9个分量组成,其排列如下所示: DATA=[ 竖直中线交点数，

竖直5/12处，

竖直7/12处，

水平中线交点数，

水平1/3处交点数，

水平2/3处交点数，

左对角线交点数，

右对角线交点数，

端点数 ];

3.3 知识库的建立

由于本文采用的是基于模式知识库的识别方法，所以对字符的结构特征的分析以及字符模型的构造是一个十分重要的环节，图3.3就是对识别数字的标准形态进行具体分析而构造的模板。

图3.3 规范手写体数字形态

以下为规范手写体数字形态的特征向量：

DATA01＝[2,2,2,2,2,2,2,2,0]；

DATA11＝[1,0,0,1,1,1,1,1,2]；

DATA21＝[3,3,3,1,1,1,1,1,3]；

DATA31＝[3,2,3,1,1,1,2,2,3]；

DATA41＝[1,1,1,2,2,1,3,2,4]；

DATA51＝[3,3,3,1,1,1,2,2,4]；

DATA61＝[3,3,2,1,1,2,3,2,1]；

DATA71＝[2,2,2,1,1,1,1,1,2]；

DATA81＝[4,4,4,2,2,2,2,2,0]；

DATA91＝[3,3,3,1,2,1,3,1,1]。

由于本系统是对自由手写体进行识别, 因而要考虑数字书写体的多变性。通过对图3.4所示的数字变体的分析来对知识库进行补充。

图3.4手写体数字变体

以下为手写体数字变体形态的特征向量：

DATA02＝[1,1,2,2,2,2,1,2,2]；

DATA22＝[3,2,2,1,1,1,1,3,2]；

DATA32＝[3,1,4,2,1,1,2,2,3]；

DATA42＝[1,2,2,3,3,1,2,2,2]；

DATA52＝[3,3,3,1,1,1,2,2,4]；

DATA62＝[3,1,3,1,1,2,2,2,2]；

DAT …… 此处隐藏：2711字，全部文档内容请下载后查看。喜欢就下载吧 ……

基于神经网络的手写数字识别系统的设计与实现(3).doc 将本文的Word文档下载到电脑，方便复制、编辑、收藏和打印

下载这篇word文档

本文链接：https://www.jiaowen.net/wenku/50720.html（转载请注明文章来源）

上一篇：申论热点时评：扣好融媒体产品的“第一粒扣子”
下一篇：2018年最新人教版七年级科学下期中试卷