教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 文库大全 > 教育文库 >

图像文本分析技术及其应用研究

来源:网络收集 时间:2026-05-17
导读: 上海交通大学 硕士学位论文 图像文本分析技术及其应用研究 姓名:汪斌 申请学位级别:硕士 专业:模式识别与智能系统 指导教师:胡福乔 20030101 上海交通大学硕士学位论文摘要 图像文本分析技术及其应用研究 摘要 文本是计算机视觉的许多应用中的一项重要特

上海交通大学

硕士学位论文

图像文本分析技术及其应用研究

姓名:汪斌

申请学位级别:硕士

专业:模式识别与智能系统

指导教师:胡福乔

20030101

上海交通大学硕士学位论文摘要

图像文本分析技术及其应用研究

摘要

文本是计算机视觉的许多应用中的一项重要特征。文本分析是数字图像处理和模式识别中的一、子领域,其主要目的是将文本图像转化为符号形式,从而利于修改、存储、检索、再利用以及传俞。文本分析,包括字符识别在内,在模式识别领域的发展早期就已经成为研究的热点;经过近几十年的发展,这个领域已经取得了巨大的发展,并在很多实际领域中得到广泛的应用[18,31]。但是,之前的研究主要侧重于简单文本图像的分析和处理,对于字符识别也是侧重于规则文本和手写体字符的识别。而随着数字图像采集、处理和传输技术,特别是由于Intemet技术突飞猛进的发展,彩色图像文本被越来越多的应用于各种场合,也就出现了大量复杂的图像文本,这给文本分析技术提出了新的要求。一般的文本图像中,或者只有文本构成,或者包含图片但是文本和图片是分离的。而图像文本中,文本是构成图像内容的一部分,与图像是不可简单分离的;而同时为了能传达更丰富的信息,其表现形式也更为变化多样。这些特点使通常的文本图像处理方法难以胜任。因而为了能有效的提取出这些图像文本中包含的内容,新的图像处理和分析方法一图像文本分析技术,就成为文本分析中的新的研究方向。

图像文本分析技术和通常的文本图像分析技术并不是完全独立的,它们之间有着紧密的联系。图像文本分析技术的最大特点就是,其所要处理的对象是具有复杂背景的一般图像,不仅包含灰度司像,也包含彩色图像;而其中的文本是作为图像的一个组成部分而嵌入在图像里面的。因此,作为图像文本分析的第一步,就是要进行图像中文本的自动检测或定位,其目的就是在图像或视频帧中提取出那些只包含文字的区域。现有的图像文本提取的方法可以分为三类:基于纹理分析技术的、基于空域连通分量分析技术的,以及基于频域分析技术的。本文提出了一种基于连通分量分析和图理论彩色聚类的彩色图像中文本自动提取的方法。首先,应用色彩的统计模型,对彩色空间进行有效的压缩,达到大大减小图像的彩色空间的目的;其次,使用基于图理论进行彩色聚类,将图像分解成对应各类的多幅二值图;然后,在这些二值图的基础上进行连通分量分析,提取可能的文本区域,并对这些区域进行鉴别;最后,综合各二值图的提取结果,得到原始彩色图像中的文本区域。和一般的基于纹理分析技术和频域分析技术的方法相比,基于连通分量分析技术的方法对图像中文本的大小和字体的变化具有更强的稳健性。提取出的文本区域经过进一步的二值化或文本一背景分离处理,就可以输入字符识别(OCR)系统中进行识别。在实际的应用中,需要处理的对象除规则的文本外,还包含由不规则的艺术字字符构成的文本。

上海交通大学硕士学位论文摘要尤其是现在的各种商业图像/图形处理软件的广泛应用,以及艺术体字符较规则字符能承载更多的信息,艺术体文本越来越多的出现在各种应用场合,特别是现在的Intemet上的各种网络文本。对于规则文本的识别,到目前为止已经有大量的研究工作以及相关的文献。而专门以艺术字体字符作为对象的研究工作和文献则比较缺少。这主要是因为:1)当前的字符识别的研究主要集中于手写体字符的识别;2)艺术体字符形式的多样性而带来的识别的困难。所以,对艺术体字符的有效识别具有很大的实际应用意义。同时,现有的规则字符的识别技术已经非常成熟,在线的和离线的手写体字符的识别研究也已经有很多的研究成果。为了能有效的利用这些现有的方法,对艺术体字符识别考虑的重点将主要放在艺术字体的规则化问题上,也就是去除构成字符的艺术化部分,得到近似规则的字符。本文提出了一种基于连通分量邻接图(CAG)的艺术体字符规则化方法。该方法和现有方法的最大区别之处就是,尝试直接描述艺术体字符中作为修饰部分的结构分量的特性。基于对这些特性的分析,判断并去除字符中的艺术修饰部分,从而达到艺术体字符的规则化目的。因此,该方法和现有的方法一样,也是作为字符识别的前期处理,目的是提高现有OCR系统对艺术体字符的识别率。

最后,综合这些图像处理方法的图像文本分析技术被应用于开发一个WEB图像文本分析和处理软件。该软件能定位和提取出用户浏览的WEB页面中包含在图像里的文本,并对它们进行在线的识别和翻译,从而更加方便用户对信息的获取和理解。

在本论文中:

◆提出了基于图像文本的图像检索系统的一般结构;

◆提出了一种基于彩色统计模型和图理论聚类以及连通分量分析的彩色图像文本定位算法;◆提出了一种基于纹理特征的彩色图像文本.背景分离方法;

◆提出了一种新的基于分量邻接图(CAG)的艺术体字符规则化方法。

关键词:图像文本分析,图像文本提取,艺术体文本识别,图像检索

THERESEARCH0FIMAGETEXTANALYSIS

ANDlTSAPPLICATlONS

ABSTRACT

Asanimportantrepresentationofhumanbeingslanguage,visualtexts

aaYewidelyusedinourdailylife.Textis

alsoamediumwhichisconvenientandcommonlyusedatoconveyandexchangeinformation.Itisasveryimportantattributeinnumberofcomputervisionapplicationssuchimageunderstanding,

adatabaseindexingandconvertingpaperdocumenttotheirelectronicversion.Textanalysisis

digitalimageprocessingandpaRemrecognition,which

tosubfieldofintoitsaimstOcoventextinimagescorrespondingsymbolrepresentation,inordermakethemodification,storage,indexing,reusingand

tenstransferofinformationconvenient.Significantdevelopmenthasbeenwitnessedinthepastofyearsin

researchoftextanalysis,includingcharacterrecognition,sincetheearlydaysofpatternrecognition[18,31].But,researchinthisareabeforemainlyfocusedontheanalysisandprocessingofthosetext

onimageswithsimplebackground,andresearchincharacterrecognitionfocused

…… 此处隐藏:2525字,全部文档内容请下载后查看。喜欢就下载吧 ……

图像文本分析技术及其应用研究.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wenku/107911.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)