教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 精品文档 > 资格考试 >

字符识别毕业设计(3)

来源:网络收集 时间:2026-02-08
导读: 武汉科技大学本科毕业设计(论文) 理,最后识别得出图片中显示的字符。 系统即可以单独使用,也可以把它作为一个识别系统的软件核心应用到车牌识别系统中去。 1.4.2 系统的基本技术要求 下面是系统具体要达到的基本

武汉科技大学本科毕业设计(论文)

理,最后识别得出图片中显示的字符。 系统即可以单独使用,也可以把它作为一个识别系统的软件核心应用到车牌识别系统中去。

1.4.2 系统的基本技术要求

下面是系统具体要达到的基本技术要求 1.输入图片中可以含有多个字符; 2.字符的识别准确率大于90%;

3.每张图片的处理时间(识别时间)不能大于1S; 4.对图片噪声具有较强的适应性; 5.系统要能长时间无故障的运行; 6.系统的操作要求简单;

1.4.3 系统的软硬件平台

(1).系统的软件平台

因为系统运行的过程当中,主要进行的都是图象处理,在这个过程当中要进行大量的数据处理,所以处理器和内存要求比较高,CUP要求主频在600HZ及其以上,内存在128MB及其 以上。

(2).系统的软件平台

系统可以运行于Windows 98, Windows2000, Windows XP或者Windows 2003操作系统下。程序调试时,需要使用Microsoft Visual C++ 6.0(SP6)。

第7页

武汉科技大学本科毕业设计(论文)

第二章 字符识别系统中的关键技术

2.1 特征提取

图像处理的高级阶段是数字图像分析(也对以称为图像理解),主要使用计算机系统,从图像中提取有用的数据或信息,生成非图像的描述或表示,如数值、符号等,即抽取图像特征,从而识别视觉图像。为了能让计算机系统认识图像,人们首先必须寻找出算法,分析图像的特征,然后将其特征用数学的办法表示出来并教会计算机也能读懂这些特征。这样,计算机才能具有认识或者识别图像的本领,称图像模式识别,也叫图像识别。要使计算机具有识别的本领,首先要得到图像的各种特征,即特征提取。

图像特征是指图像的原始特性或属性。每一幅图像都有其本身的特征,其中有些是视觉直接感受到的自然特征,如亮度、边缘的轮廓、纹理或色彩等;有些是需要通过变换或测量才能得到的人为特征,如谱、直方图等。

图像特征提取的结果给出了某一具体的图像中与其他图像相区别的特征。例如,描述物体表面灰度变化的纹理特征,描述物体外形的形状特征等。

2.1.1 特征提取基本概念

图像识别是根据一定的图像特征进行的,显然这些特征的选择很重要,它强烈地影响到图像识别分类器的设计、性能及其识别结果的准确性。特征选择错误,分类就个能分得准确,甚至无法分类。因此,特征选择是图像识别中的一个关键问题。由于实际问题中常常不容易找到那些最重要的特征,或者某些图像特征还会随着环境的变化而发生变化,这就使得特征的选择和提取复杂化。

特征选择和提取的基本任务是如何从众多特征中找出那些最有效的特征。在样本数量不是很多的情况下,用很多特征进行分类器设计,从计算复杂程度和分类器性能来看都是不适宜的。因此研究如何把高维特征宁间压缩到低维特征空间以便有效地识别图像成为一个重要的课题,例如手写体文字识别的特征选择的研究已将近半个世纪,但依然是一个研究的难点和热点。

为了进行识别,需要把图像从测量空间变换到维数大大减少的特征空间,被

第8页

武汉科技大学本科毕业设计(论文)

识别的图像在这个特征空中就是由一个特征向量来表示。为了方便起见,对几个经常用道的有关名词作一些说明。

1. 特征形成

根据待识别的图像,通过计算机产生一维原始特征,称之为特征形成。 2. 特征提取

原始特征的数量很大,或者说图像本身处于一个高维空间中,通过映射(或变换)的方法可以用低维空间来表示样本,这个过程叫做特征提取。映射后的特征是原始特征某种组合。所谓特征提取在广义上说是一种变换。

3. 特征提取

从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的,这个过程叫做特征选择。

目前几乎没有解析的方法能够知道特征的选择,很多情况下,凭直觉的引导可以列出一些可能的特征表,然后用特征排序的方法计算不同特征的识别效率。利用其结果对表进行删减,从而选出若干最好的特征。

良好的特征应具备以下4个特点:

(1) 可区别性。对属于不同类的图像来说,他们的特征应具备明显的差异。 (2) 可靠性。对于不同类型的图像,特征值应该比较接近。例如,杂志封面的文字图像的分割中,颜色是一个不好的特征。因为,封面文字的颜色可以是各种色彩,尽管它们都属于文字图像。

(3) 独立性好。所选择的特征之间彼此不相关。例如细胞的曲径和细胞的面积高度相关,因为面积大致与直径的平方成正比。这两个特征基本上反映的是相同的属性,即细胞的大小。但是,有时相关性很高的特征组合起来可以减少噪声干扰,它们一般不作为单独的特征使用。

(4) 数量少。图像识别系统的复杂程度随着系统维数(特征的个数)迅速增长。尤为重要的是用来训练分类器和测试结果的图像样本随特征数量呈指数关系增长。而且,增加带噪声的特征或与现存特征相关性高的特征实际上会使识别系统的性能下降。

实际应用中特征提取过程往往包括:先测试一组自觉上合理的特征,然后减少成数目合适的满意集。通常符合上述要求的理想特征是很少甚至没有的。

第9页

武汉科技大学本科毕业设计(论文)

对计算机图像识别系统而言,物体的形状是一个赖以识别的重要特征。一个图像形状和结构特征有两种形式,一种是数字特征主要包括几何属性(如长短、面积、距离和凹凸特性等),统计属性(如黑色像素点在垂直方向的投影)和拓扑属性(如连通、欧拉数);另一种是由字符串和图等所表示的句法语言。它可以刻画某一图像不同部分之间的相互关系(如文字识别中的笔划关系),也可以描述不同目标间的关系。

由于感兴趣的是图像的形状和结构特征,所以其灰度信息往往可以忽略,只要能将它与其他目标或背景区分开来即可。常用的一种技术是二值化图像,即将感兴趣的部分(区域或边界)标以最大灰度级,把背景(也包括其他任何不感兴趣的部分)标以最小灰度级,通常为零。二值化图像在形状和结构分析中占有很重要的地位,本节讨论的算法如没有特别说明都是基于二值化图像的。

2.1.2 区域内部的数字特征

1. 矩

给定二维连续函数f(x,y),下式定义了其pq阶矩:

(2.1)

矩在文字识别中作为有效统计特征而被广泛运用,它之所以能被用来表征一幅二维图像是基于下面的帕普利斯(Papoulis)惟一性定理:如果f(x,y)是分段连续的,只在xy平面的有限部分中有非零值,则所有各阶矩皆存在,并且矩序列{Mpq}此才惟一地被f(x,y)所确定,反之{Mpq}也唯一地确正f(x,y)。

对一幅二值图像{ f(x,y):i,j=0,1,2?N-1}来说,上述条件无疑可被满足。因此,可定义其pq阶矩为:

Mpq=∑∑f(i,j)ipjq (2.2)

不同p、q值下可以得到不同的图像矩Mpq。,常用的区域矩特征有以下几个: (1) 质心

(2) 中心矩

(3) Hu矩组

(2.4)

(2.3)

第10页

武汉科技大学本科毕业设计(论文)

Hu矩组是{mpq}个矩的函数,它满足平移、旋转不变性,因而可被广泛地应用于区域形状识别中。

M1=m20+m02

M2=(m20-m02)2+4m112 M3=(m30-3m …… 此处隐藏:2106字,全部文档内容请下载后查看。喜欢就下载吧 ……

字符识别毕业设计(3).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wendang/412269.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)