图像文本分析技术及其应用研究
上海交通大学
硕士学位论文
图像文本分析技术及其应用研究
姓名:汪斌
申请学位级别:硕士
专业:模式识别与智能系统
指导教师:胡福乔
20030101
上海交通大学硕士学位论文摘要
图像文本分析技术及其应用研究
摘要
文本是计算机视觉的许多应用中的一项重要特征。文本分析是数字图像处理和模式识别中的一、子领域,其主要目的是将文本图像转化为符号形式,从而利于修改、存储、检索、再利用以及传俞。文本分析,包括字符识别在内,在模式识别领域的发展早期就已经成为研究的热点;经过近几十年的发展,这个领域已经取得了巨大的发展,并在很多实际领域中得到广泛的应用[18,31]。但是,之前的研究主要侧重于简单文本图像的分析和处理,对于字符识别也是侧重于规则文本和手写体字符的识别。而随着数字图像采集、处理和传输技术,特别是由于Intemet技术突飞猛进的发展,彩色图像文本被越来越多的应用于各种场合,也就出现了大量复杂的图像文本,这给文本分析技术提出了新的要求。一般的文本图像中,或者只有文本构成,或者包含图片但是文本和图片是分离的。而图像文本中,文本是构成图像内容的一部分,与图像是不可简单分离的;而同时为了能传达更丰富的信息,其表现形式也更为变化多样。这些特点使通常的文本图像处理方法难以胜任。因而为了能有效的提取出这些图像文本中包含的内容,新的图像处理和分析方法一图像文本分析技术,就成为文本分析中的新的研究方向。
图像文本分析技术和通常的文本图像分析技术并不是完全独立的,它们之间有着紧密的联系。图像文本分析技术的最大特点就是,其所要处理的对象是具有复杂背景的一般图像,不仅包含灰度司像,也包含彩色图像;而其中的文本是作为图像的一个组成部分而嵌入在图像里面的。因此,作为图像文本分析的第一步,就是要进行图像中文本的自动检测或定位,其目的就是在图像或视频帧中提取出那些只包含文字的区域。现有的图像文本提取的方法可以分为三类:基于纹理分析技术的、基于空域连通分量分析技术的,以及基于频域分析技术的。本文提出了一种基于连通分量分析和图理论彩色聚类的彩色图像中文本自动提取的方法。首先,应用色彩的统计模型,对彩色空间进行有效的压缩,达到大大减小图像的彩色空间的目的;其次,使用基于图理论进行彩色聚类,将图像分解成对应各类的多幅二值图;然后,在这些二值图的基础上进行连通分量分析,提取可能的文本区域,并对这些区域进行鉴别;最后,综合各二值图的提取结果,得到原始彩色图像中的文本区域。和一般的基于纹理分析技术和频域分析技术的方法相比,基于连通分量分析技术的方法对图像中文本的大小和字体的变化具有更强的稳健性。提取出的文本区域经过进一步的二值化或文本一背景分离处理,就可以输入字符识别(OCR)系统中进行识别。在实际的应用中,需要处理的对象除规则的文本外,还包含由不规则的艺术字字符构成的文本。
上海交通大学硕士学位论文摘要尤其是现在的各种商业图像/图形处理软件的广泛应用,以及艺术体字符较规则字符能承载更多的信息,艺术体文本越来越多的出现在各种应用场合,特别是现在的Intemet上的各种网络文本。对于规则文本的识别,到目前为止已经有大量的研究工作以及相关的文献。而专门以艺术字体字符作为对象的研究工作和文献则比较缺少。这主要是因为:1)当前的字符识别的研究主要集中于手写体字符的识别;2)艺术体字符形式的多样性而带来的识别的困难。所以,对艺术体字符的有效识别具有很大的实际应用意义。同时,现有的规则字符的识别技术已经非常成熟,在线的和离线的手写体字符的识别研究也已经有很多的研究成果。为了能有效的利用这些现有的方法,对艺术体字符识别考虑的重点将主要放在艺术字体的规则化问题上,也就是去除构成字符的艺术化部分,得到近似规则的字符。本文提出了一种基于连通分量邻接图(CAG)的艺术体字符规则化方法。该方法和现有方法的最大区别之处就是,尝试直接描述艺术体字符中作为修饰部分的结构分量的特性。基于对这些特性的分析,判断并去除字符中的艺术修饰部分,从而达到艺术体字符的规则化目的。因此,该方法和现有的方法一样,也是作为字符识别的前期处理,目的是提高现有OCR系统对艺术体字符的识别率。
最后,综合这些图像处理方法的图像文本分析技术被应用于开发一个WEB图像文本分析和处理软件。该软件能定位和提取出用户浏览的WEB页面中包含在图像里的文本,并对它们进行在线的识别和翻译,从而更加方便用户对信息的获取和理解。
在本论文中:
◆提出了基于图像文本的图像检索系统的一般结构;
◆提出了一种基于彩色统计模型和图理论聚类以及连通分量分析的彩色图像文本定位算法;◆提出了一种基于纹理特征的彩色图像文本.背景分离方法;
◆提出了一种新的基于分量邻接图(CAG)的艺术体字符规则化方法。
关键词:图像文本分析,图像文本提取,艺术体文本识别,图像检索
THERESEARCH0FIMAGETEXTANALYSIS
ANDlTSAPPLICATlONS
ABSTRACT
Asanimportantrepresentationofhumanbeingslanguage,visualtexts
aaYewidelyusedinourdailylife.Textis
alsoamediumwhichisconvenientandcommonlyusedatoconveyandexchangeinformation.Itisasveryimportantattributeinnumberofcomputervisionapplicationssuchimageunderstanding,
adatabaseindexingandconvertingpaperdocumenttotheirelectronicversion.Textanalysisis
digitalimageprocessingandpaRemrecognition,which
tosubfieldofintoitsaimstOcoventextinimagescorrespondingsymbolrepresentation,inordermakethemodification,storage,indexing,reusingand
tenstransferofinformationconvenient.Significantdevelopmenthasbeenwitnessedinthepastofyearsin
researchoftextanalysis,includingcharacterrecognition,sincetheearlydaysofpatternrecognition[18,31].But,researchinthisareabeforemainlyfocusedontheanalysisandprocessingofthosetext
onimageswithsimplebackground,andresearchincharacterrecognitionfocused
…… 此处隐藏:2525字,全部文档内容请下载后查看。喜欢就下载吧 ……
相关推荐:
- [教育文库]夜场KTV服务员的岗位职责及工作流程[1]
- [教育文库]企划、网络、市场绩效考核方案
- [教育文库]学党史、知党情、强党性--“党的基本理
- [教育文库]2016年高考物理大一轮总复习(江苏专版
- [教育文库]干部廉洁自律自查自纠的报告
- [教育文库]2010年北京大学心理学系拟录取硕士研究
- [教育文库]资金时间价值练习题及答案
- [教育文库]保护环境的心得体会
- [教育文库]英语角内容:英语趣味小知识
- [教育文库]档案收集与管理工作通知
- [教育文库]劳动规章制度范本范本
- [教育文库]高考物理一轮复习课后限时作业1运动的
- [教育文库]机械工艺夹具毕业设计195推动架设计说
- [教育文库]通用技术教学比赛说课稿2
- [教育文库]2018年四年级英语下册 Module 7 Unit 2
- [教育文库]第2章 宽带IP网络的体系结构
- [教育文库]九年级化学第五单元课题3《根据化学方
- [教育文库]小学英语六年级情态动词用法归纳
- [教育文库]甲级单位编制窑井盖项目可行性报告(立
- [教育文库]2016-2021年中国城市规划行业全景调研
- 高考英语听力十大场景词汇总结
- 全省领导班子思想政治建设座谈会会议精
- 人教版新课标高一英语提优竞赛试题 下
- 江西省2014年生物中考试题
- 长沙镇食品药品安全事故应急预案
- 《金刚石、石墨和C60》片段教学设计
- 福州教育学院(王旭东)
- 基于EDA音乐播放器的设计
- 9、古诗两首《夜书所见》《九月九日忆
- 小学语文课外阅读有效策略探讨
- 贵州文化产业发展成支柱产业的问卷调查
- 膀胱类癌的诊治体会(附3例报告)
- 发动机积碳产生的原因
- Configuring Code Composer Studio for
- 学生良好的心理素质如何培养点滴谈
- 46 电沉积法制备锂离子电池用硅-锂薄膜
- 美舍雅阁公司管理中各部门职责
- 去壳剥皮的小妙招
- 六自由度运动平台的仿真研究
- Pride and Prejudice(傲慢与偏见)




