教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 文库大全 > 教育文库 >

图像文本分析技术及其应用研究(4)

来源:网络收集 时间:2026-05-17
导读: 保密嘭在上年解密后适用本授权书 。 本学位论文属于 不保密口。/ (请在以上方框内打“4”) 学位论文作者签名:(童3趴 日期:u。)年f月17El指导教师签名:戗哟日期:∥涉’『月j7日 _kN2NX-4

保密嘭在上年解密后适用本授权书 。

本学位论文属于

不保密口。/

(请在以上方框内打“4”)

学位论文作者签名:(童3趴

日期:u。)年f月17El指导教师签名:戗哟日期:∥涉’『月j7日

_kN2NX-4f硕士学位论文第一章:缝论

第一章绪论

信息技术在刚刚过去的二十世纪经历了空前的发展。由于文本、语音、图像和视频等多媒体的出现和交融,使得信息的内容越来越丰富;同时,由于计算机技术和网络技术的飞速发展,使得信息的产生、处理和传输的各个环节都发生了变革性的进步,其结果是引起了信息资源内容的爆炸式的增长,即通常所说的“信息爆炸"。信息的产生、处理和传输是信息社会前进的基础;但是,整体来说,信息量的增长速度大大超过了现有的信息处理技术的发展。面对浩瀚的信息海洋,我们反而变得无所适从。因而,为了能有效的利用这些爆炸式增长的信息资源,能从大量的信息资源中迅速找到真正符合需要的有用信息,如何对这些大量的不断增长的信息进行有效的管理,就变得越来越重要。

作为信息管理的具体内容,对于如何有效的组织、存储、搜索和利用这些多媒体信息,就成为人们关注的热点。这也促使发展各种有效的各种图像、视频、音频以及综合这些媒体的有效检索技术成为近些年的研究热点。在检索技术中,有效的对于检索对象的描述方法以及相应的搜索方法是检索获得成功的关键所在。I_nternet上的多媒体以图像为主,考察图像检索技术的发展,可以看到它经历了两个阶段:第一阶段是以关键字为基础的检索;第二阶段是以图像自身的内容为基础的检索,即基于内容的图像检索(CBIR:Content—BasedImageRetrieval)。

在基于关键字的图像检索系统中,需要先对所有的图像进行关键字标注,然后才能使用全文检索技术对图像进行搜索。这种方法存在两个方面的问题:一是这种方法需要较多的人工参与,而且随着图像数目的增加,这种方法很难实现;第二个问题在于图像所包含的信息量庞大,不同的人对于同一张图像的理解也不相同,这就导致对图像的标注没有一个统一的标准,因而检索的结果往往不能很好地符合用户的需求。

基于内容的检索不同于基于关键字的检索,它不需要过多的人工参与,而利用图像自身的特征(如颜色、纹理、形状等)来进行检索,具有较强的客观性。基于内容的图像检索系统的一般结构如图1.1所示。基于内容的图像检索技术涉及到图像处理和模式识别技术的各个方面,其主要的组成部分包括:图像预处理、图像特征提取、特征选择、图像(特征)相似性度量以及特征(图像内容)空间搜索和匹配[521。近些年,许多研究者在基于内容的图像检索技术做了大量的研究[71.75],因此,在上述各个相关的研究方向也都取得了很大的进展。同时,为了克服现有的基于内容图像检索技术的不足,相关反馈技术也被提出并融合进现有的技术中,以求增加使用者的互动,从而得到使用者更加满意的检索结果。但是,由于这些特征大多是从描述图像像素的强度值分布出发的,

上海交通大学硕士学位论文第一章:绪论只描述了图像像素强度值的分布规律,而并不代表图像真正的语义信息,因此基于内容的检索结果往往不令人满意;同时,相关反馈(relevancefeedback)技术[72,741的应用,虽然提高了检索结果的满意程度,但这是以增加使用者的人工参与作为代价的。最后,基于内容的图像检索技术中,在作为其核心组成部分的特征计算过程中,往往要计算图像的数十甚至上百个的各种特征;因此,其需要消耗很大的计算量,而降低了整体的检索效率。综上所述,虽然基于内容的图像检索技术在近年来取得了很大的发展,但是从根本来说,这项技术还处于其发展初期,远未成熟,还有许多问题需要解决。

图1.1.基于内容图像检索系统的一般结构

Figure1—1.Genericstructureforcontent-basedimageretrievalsystems

基于关键字的图像检索技术有其固有的缺陷,但是基于关键字检索技术发展的相对成熟,并且基于内容的图像检索技术的还远未成熟。因此,基于关键字的检索技术还将存在很长一段时间。在相关的诸如图像处理、图像理解或模式识别等技术还不能胜任真正的基于内容检索技术的要求的过渡时期,对某些特定的应用而言,结合关键字检索和基于内容检索技术一体的检索技术将具有很大的吸引力。很多场合下,图像中都会有文本出现,而这些文本往往和图像的真正的语义内容有很密切的关系。因此,对于这类包含文本的图像的检索,一种可能的解决办法就是:首先提取出其中的文本部分;然后对提取出的文本进行识别,得到文本的语义含义;最后,结合现有的关键字检索技术,进行图像的检索。图1.2中给出了基于图像文本的图像检索系统的结构,其中的图像存档和索引技术都使用现今非常成熟的基于关键字的数据库技术。为达到这个目的,需要结合图像文本分析、文本/字符识别以及相关的检索技术。在本文中,我们的重点放在图像文本分析和文本/字符识别上。

文本是计算机视觉的许多应用中的一项重要特征。许多图像,特别是那些用于网页

/-海交通大学硕士学位论文第一章:绪论制作的图像以及视频中,都包含有可见的文本。文本分析是数字图像处理中的一个子领域,其主要目的是将文本图像转化为符号形式,从而利于修改、存储、检索、再利用以及传输。文本分析,包括字符识别在内,在模式识别领域的发展早期就已经成为研究的热点;经过近几十年的发展,这个领域已经取得了巨大的发展,并在很多实际领域中得到广泛的应用[2,3,18,31,32,42,46]。但是,之前的研究主要侧重于简单文本图像的分析和处理,对于字符识别也是侧重于规则文本和手写体字符的识别。而随着数字图像采集、处理和传输技术,特别是由于Intemet技术突飞猛进的发展,彩色图像文本被越来越多的应用于各种场合,也就出现了大量复杂的图像文本,这为文本分析技术提出了新的要求。一般的文本图像中,或者只有文本构成,或者包含图片但是文本和图片是分离的。而图像文本中,文本是构成图像内容的一部分,与图像是不可简单分离的;而同时为了能传达更丰富的信息,其表现形式也更为变化多样。并且,和传统的文本图像处理的对象相比,图像文本还具有以下几个特点:1)图像中文本的数量少;2)这些少量的文本却往往携带了和图像内容密切相关的重要信息;3)同一幅图像中文本的表现形式,如字体、大小、颜色、对齐方式等,也是变化多样的[43】。这些特点使通常的文本图像处理方法难以胜任。如果这些复杂图像中包含的文本能被自动的检测、分割以及识别出来,也就能为图像或信息的检索提供很有价值的高级的语义描述信息。因而为了能有效的提取出这些图像文本中包含的内容,新的图像处理和分析方法一图像文本分析技术,就成为文本分析中的新的研究方向。

图1.2.基于图像文本的图像检索系统

Figure1—2.Structureforimagetextbasedimageretrievalsystem

图像文本分析技术和通常的文本图像分析技术并不是完全独立的,它们之间有着紧密的联系。图像文本分析技术的最大特点就是,其所要处理的对象是具有复杂背景的一

上海交通大学硕士学位论文第一章:绪 …… 此处隐藏:2826字,全部文档内容请下载后查看。喜欢就下载吧 ……

图像文本分析技术及其应用研究(4).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wenku/107911.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)