基于神经网络的手写数字识别系统的设计与实现(3)
end
end
imshow(N)
例如,数字图像“0.bmp”经该归一化算法计算得到矩阵 M,MATLAB 运行结果如图2.4所示。
图2.4 归一化处理
2.3.4 细化
许多字符识别方法在预处理中都很重视对二值化字符的细化处理。直观来说,细化就是将二值化字符点阵逐层剥去轮廓上的点,变成笔画宽度只有一个像素宽度的字符骨架图形。之所以需要细化处理,是因为二值化点阵图形中,对识别有价值
的文字特征信息主要集中在字符骨架上,细化后的字符骨架既保留了原字符的绝大部分的特征,又利于特征提取。细化后骨架的存储量比原来的二值化字符点阵要少得多,降低了处理工作量。
手写体数字细化的基本要求如下:
第一、保持原有字符笔画的连续性,不能由于细化造成笔画断裂。
第二、要细化为单线,即笔画宽度为一个像素。
第三、细化后的骨架应尽量是原来笔画的中心线。
2.4 小结
预处理是手写数字识别中不可缺少的组成部分,对图像预处理的好坏直接影响到识别的结果, 关系到识别算法的好坏。文中首先对待识别数字的预处理进行了介绍,包括平滑去噪、二值化、归一化、细化等图像处理方法,经过这些预处理步骤, 对图像中部分变形信息进行了修正, 消除图像中与识别无关的因素, 而且尽量保持原图像的字符特征, 在实验中提高了数字识别网络的性能。
第三章 特征提取
3.1 特征提取的概述
模式识别使用特征来区分不同的种类。因此,特征提取是模式识别系统的关键部分。特征提取的目标是找到某种变换,将N维或N*N维的模式类别空间转换到维数小得多的M维特征空间,并同时保留模式识别所需要的大部分信息。通过特征提取,模式分类可以在维数低得多的空间上进行,从而降低了计算的复杂度。而且,对给定的训练样本进行特征提取可以获得更精确的分类函数的描述,以构造更可靠的分类规则。
同样对于手写体数字的识别,特征提取可以降低字符信息量、去除无用的冗余信息,提高识别系统效率,一直是字符识别领域中的关键点。
特征提取的目的是从原始数据中抽取出用于区分不同类型的本质特征。无论是识别过程还是学习过程,都要对研究对象固有的、本质的重要特征或属性进行量测并将结果数值化,形成特征矢量。
手写体数字的识别中,常用的特征有结构特征和统计特征。结构特征和统计特征各有其优点:结构特征能描述字符的结构,对于不同人书写的字符,形体不同,但结构都是一致的,所以结构特征能克服手写字体因人而引起的畸变;统计特征最大的优点是对环境噪音不敏感,如若字符的背景噪音通常都是呈高斯分布,用统计特征进行识别可对此影响忽略不计。本章将用两小节分别对结构特征和统计特征进行论述。
3.2 统计特征
对复杂图像信号作小波变换[11],进行多分辨率分析,已经成为图像信号分析和处理的常用方法。由于小波变换的结果体现为大量的小波分解系数,这些系数包含了系统或信号本身大量和多样的特征信息。如果图像信号的主要信息能以一个或一组特征量来表征,我们就可以更加直观、有效和方便地对各种随机信号进行信息提取、信号检测、特征识别。
统计特征分为宏观特征信息和局部特征信息。宏观特征信息是需要在整幅图像上获取的特征信息。传统的全局特征主要包括:全局变换特征(对字符图像进行各种变换,利用变换系数作为特征向量,常用的变换有Fourier变换、K-L变换、小波变换等)、不变矩特征、全局笔划方向特征等;常用的局部统计特征有:局部笔划方向特征、Gabor特征等。统计特征对微小的畸变不敏感,但区分相似的能力较差。
以下为程序设计中对小波分析提取低频部分的统计特征的实例:
f=imread('sample.bmp');输入图像
[c,s]=wavedec2(h,3,'db2');对人脸图像进行3阶小波分解,并提取小波系数
wave2gray(c,s,8);显示小波分解后各子图
y=wavecopy('a',c,s)
figure,imshow(mat2gray(y));提取主要特征
3.3 结构特征
采用结构特征[12]对字符进行结构分析从而达到识别目的,是一种非常直观的方法。字符由各个子部件构成,逐级分析字符图像的结构,根据各元素的属性、数量及其相互关系,便可判定待识字符。与统计方法相比,结构分析不注重特征的绝对位置,只考虑特征的相对关系,因而对书写风格的变化不敏感,其缺点在于特征提取和模板的建立都十分困难,匹配算法也比较复杂,神经网络的应用弥补了这个缺点,只要提取出适当的结构向量作为神经网络的输入向量,会得到令人满意的识别输出结果。以下详细介绍。
3.3.1 结构特征提取
首先对经预处理后的图像进行分割,如图3.1所示。
图3.1 图像分割
对图像分割后,结构特征提取的算法如下:
(1)对细化后的数字图像取竖直的三条直线,分别取在5/12,1/2,7/12处,记下这三条竖直直线与数字笔段的交点数。
(2)再取水平三条直线,分别取在1/3,1/2,2/3处, 分别记下这三条水平直线与数字笔段的交点数。
(3)再取对角两条直线, 分别记下这两条对角直线与数字笔段的交点数。
3.3.2 笔划特征的提取
经细化后的数字图像其特征较为稳定,且笔划简单,因此对其抽取的基本结构组件能反映数字的本质特征,从而可快速有效地识别数字,并达到较好的分类效果。数字端点如图3.2所示。
图3.2数字端点
对图像分割后,结构特征提取的算法如下:
(1)按从上到下,从左到右的顺序扫描预处理后图像并选择黑像素点P;
(2)计算像素P的8-邻域之和N;
(3)若N=1,则像素P为端点,端点计数器加一;
(4)重复步骤(1)-(3),直到遍历整个图像。
3.3.3 数字的特征向量说明
依据上述特征提取方法,本系统中的特征矢量由9个分量组成,其排列如下所示: DATA=[ 竖直中线交点数,
竖直5/12处,
竖直7/12处,
水平中线交点数 ,
水平1/3处交点数,
水平2/3处交点数,
左对角线交点数,
右对角线交点数,
端点数 ];
3.3 知识库的建立
由于本文采用的是基于模式知识库的识别方法,所以对字符的结构特征的分析以及字符模型的构造是一个十分重要的环节,图3.3就是对识别数字的标准形态进行具体分析而构造的模板。
图3.3 规范手写体数字形态
以下为规范手写体数字形态的特征向量:
DATA01=[2,2,2,2,2,2,2,2,0];
DATA11=[1,0,0,1,1,1,1,1,2];
DATA21=[3,3,3,1,1,1,1,1,3];
DATA31=[3,2,3,1,1,1,2,2,3];
DATA41=[1,1,1,2,2,1,3,2,4];
DATA51=[3,3,3,1,1,1,2,2,4];
DATA61=[3,3,2,1,1,2,3,2,1];
DATA71=[2,2,2,1,1,1,1,1,2];
DATA81=[4,4,4,2,2,2,2,2,0];
DATA91=[3,3,3,1,2,1,3,1,1]。
由于本系统是对自由手写体进行识别, 因而要考虑数字书写体的多变性。通过对图3.4所示的数字变体的分析来对知识库进行补充。
图3.4手写体数字变体
以下为手写体数字变体形态的特征向量:
DATA02=[1,1,2,2,2,2,1,2,2];
DATA22=[3,2,2,1,1,1,1,3,2];
DATA32=[3,1,4,2,1,1,2,2,3];
DATA42=[1,2,2,3,3,1,2,2,2];
DATA52=[3,3,3,1,1,1,2,2,4];
DATA62=[3,1,3,1,1,2,2,2,2];
相关推荐:
- [教学研究]2012西拉科学校团少队工作总结
- [教学研究]建筑工程公司档案管理制度
- [教学研究]小学数学人教版六年级上册圆的周长和面
- [教学研究]ERP电子行业解决方案
- [教学研究]钢支撑租赁合同范本
- [教学研究]预应力自动张拉系统用户手册Rev1.0
- [教学研究]MOOC课程:金瓶梅人物写真(每章节课后
- [教学研究]追加被执行人申请书(适用追加夫妻关系)
- [教学研究]2014年驾考科目一考试最新题库766
- [教学研究]2013-2014学年度九年级物理第15章《电
- [教学研究]新版中日交流标准日本语初级下26课-客
- [教学研究]小导管注浆施工作业指导书
- [教学研究]一般财务人员能力及人岗匹配评估表
- [教学研究]打1.2.页 小学一年级暑假口算100以内加
- [教学研究]学习贯彻《中国共产党党和国家机关基层
- [教学研究]2012年呼和浩特市中考试卷_35412
- [教学研究]最简易的电线电缆购销合同范本
- [教学研究]如何开展安全标准化建设
- [教学研究]工作分析与人岗匹配
- [教学研究]2016-2017学年高中历史第七单元现代中
- 山东省义务教育必修地方课程小学三年级
- 台湾宜兰大学互联网交换技术课程 01_In
- 思想品德:第一课《我知我家》课件(人
- SAR合成孔径雷达图像点目标仿真报告(附
- 利辛县“十三五”规划研究报告
- 2015-2020年中国手机APP行业市场发展趋
- 广告策略、创意表现、媒体方案
- 企业如何申请专利的的几点思考
- 《中国教育简史》网上作业
- 高中历史第二单元西方人文精神的起源及
- 年终晚会必备_精彩的主持稿_精心整理_
- 信息工程专业自荐书
- 2019高考历史人教版一轮练习:第十二单
- JAVA俱乐部管理系统软件需求规格说明书
- 2016-2021年中国小型板料折弯机行业市
- (人教新课标)六上_比的基本性质课件PPT
- 辽宁省公务员考试网申论备考技巧:名言
- 神经阻滞麻醉知情同意书
- 施工企业信息填报、审核和发布的相关事
- 初一(七年级)英语完形填空100篇




