图像文本分析技术及其应用研究(4)
保密嘭在上年解密后适用本授权书 。
本学位论文属于
不保密口。/
(请在以上方框内打“4”)
学位论文作者签名:(童3趴
日期:u。)年f月17El指导教师签名:戗哟日期:∥涉’『月j7日
_kN2NX-4f硕士学位论文第一章:缝论
第一章绪论
信息技术在刚刚过去的二十世纪经历了空前的发展。由于文本、语音、图像和视频等多媒体的出现和交融,使得信息的内容越来越丰富;同时,由于计算机技术和网络技术的飞速发展,使得信息的产生、处理和传输的各个环节都发生了变革性的进步,其结果是引起了信息资源内容的爆炸式的增长,即通常所说的“信息爆炸"。信息的产生、处理和传输是信息社会前进的基础;但是,整体来说,信息量的增长速度大大超过了现有的信息处理技术的发展。面对浩瀚的信息海洋,我们反而变得无所适从。因而,为了能有效的利用这些爆炸式增长的信息资源,能从大量的信息资源中迅速找到真正符合需要的有用信息,如何对这些大量的不断增长的信息进行有效的管理,就变得越来越重要。
作为信息管理的具体内容,对于如何有效的组织、存储、搜索和利用这些多媒体信息,就成为人们关注的热点。这也促使发展各种有效的各种图像、视频、音频以及综合这些媒体的有效检索技术成为近些年的研究热点。在检索技术中,有效的对于检索对象的描述方法以及相应的搜索方法是检索获得成功的关键所在。I_nternet上的多媒体以图像为主,考察图像检索技术的发展,可以看到它经历了两个阶段:第一阶段是以关键字为基础的检索;第二阶段是以图像自身的内容为基础的检索,即基于内容的图像检索(CBIR:Content—BasedImageRetrieval)。
在基于关键字的图像检索系统中,需要先对所有的图像进行关键字标注,然后才能使用全文检索技术对图像进行搜索。这种方法存在两个方面的问题:一是这种方法需要较多的人工参与,而且随着图像数目的增加,这种方法很难实现;第二个问题在于图像所包含的信息量庞大,不同的人对于同一张图像的理解也不相同,这就导致对图像的标注没有一个统一的标准,因而检索的结果往往不能很好地符合用户的需求。
基于内容的检索不同于基于关键字的检索,它不需要过多的人工参与,而利用图像自身的特征(如颜色、纹理、形状等)来进行检索,具有较强的客观性。基于内容的图像检索系统的一般结构如图1.1所示。基于内容的图像检索技术涉及到图像处理和模式识别技术的各个方面,其主要的组成部分包括:图像预处理、图像特征提取、特征选择、图像(特征)相似性度量以及特征(图像内容)空间搜索和匹配[521。近些年,许多研究者在基于内容的图像检索技术做了大量的研究[71.75],因此,在上述各个相关的研究方向也都取得了很大的进展。同时,为了克服现有的基于内容图像检索技术的不足,相关反馈技术也被提出并融合进现有的技术中,以求增加使用者的互动,从而得到使用者更加满意的检索结果。但是,由于这些特征大多是从描述图像像素的强度值分布出发的,
上海交通大学硕士学位论文第一章:绪论只描述了图像像素强度值的分布规律,而并不代表图像真正的语义信息,因此基于内容的检索结果往往不令人满意;同时,相关反馈(relevancefeedback)技术[72,741的应用,虽然提高了检索结果的满意程度,但这是以增加使用者的人工参与作为代价的。最后,基于内容的图像检索技术中,在作为其核心组成部分的特征计算过程中,往往要计算图像的数十甚至上百个的各种特征;因此,其需要消耗很大的计算量,而降低了整体的检索效率。综上所述,虽然基于内容的图像检索技术在近年来取得了很大的发展,但是从根本来说,这项技术还处于其发展初期,远未成熟,还有许多问题需要解决。
图1.1.基于内容图像检索系统的一般结构
Figure1—1.Genericstructureforcontent-basedimageretrievalsystems
基于关键字的图像检索技术有其固有的缺陷,但是基于关键字检索技术发展的相对成熟,并且基于内容的图像检索技术的还远未成熟。因此,基于关键字的检索技术还将存在很长一段时间。在相关的诸如图像处理、图像理解或模式识别等技术还不能胜任真正的基于内容检索技术的要求的过渡时期,对某些特定的应用而言,结合关键字检索和基于内容检索技术一体的检索技术将具有很大的吸引力。很多场合下,图像中都会有文本出现,而这些文本往往和图像的真正的语义内容有很密切的关系。因此,对于这类包含文本的图像的检索,一种可能的解决办法就是:首先提取出其中的文本部分;然后对提取出的文本进行识别,得到文本的语义含义;最后,结合现有的关键字检索技术,进行图像的检索。图1.2中给出了基于图像文本的图像检索系统的结构,其中的图像存档和索引技术都使用现今非常成熟的基于关键字的数据库技术。为达到这个目的,需要结合图像文本分析、文本/字符识别以及相关的检索技术。在本文中,我们的重点放在图像文本分析和文本/字符识别上。
文本是计算机视觉的许多应用中的一项重要特征。许多图像,特别是那些用于网页
/-海交通大学硕士学位论文第一章:绪论制作的图像以及视频中,都包含有可见的文本。文本分析是数字图像处理中的一个子领域,其主要目的是将文本图像转化为符号形式,从而利于修改、存储、检索、再利用以及传输。文本分析,包括字符识别在内,在模式识别领域的发展早期就已经成为研究的热点;经过近几十年的发展,这个领域已经取得了巨大的发展,并在很多实际领域中得到广泛的应用[2,3,18,31,32,42,46]。但是,之前的研究主要侧重于简单文本图像的分析和处理,对于字符识别也是侧重于规则文本和手写体字符的识别。而随着数字图像采集、处理和传输技术,特别是由于Intemet技术突飞猛进的发展,彩色图像文本被越来越多的应用于各种场合,也就出现了大量复杂的图像文本,这为文本分析技术提出了新的要求。一般的文本图像中,或者只有文本构成,或者包含图片但是文本和图片是分离的。而图像文本中,文本是构成图像内容的一部分,与图像是不可简单分离的;而同时为了能传达更丰富的信息,其表现形式也更为变化多样。并且,和传统的文本图像处理的对象相比,图像文本还具有以下几个特点:1)图像中文本的数量少;2)这些少量的文本却往往携带了和图像内容密切相关的重要信息;3)同一幅图像中文本的表现形式,如字体、大小、颜色、对齐方式等,也是变化多样的[43】。这些特点使通常的文本图像处理方法难以胜任。如果这些复杂图像中包含的文本能被自动的检测、分割以及识别出来,也就能为图像或信息的检索提供很有价值的高级的语义描述信息。因而为了能有效的提取出这些图像文本中包含的内容,新的图像处理和分析方法一图像文本分析技术,就成为文本分析中的新的研究方向。
图1.2.基于图像文本的图像检索系统
Figure1—2.Structureforimagetextbasedimageretrievalsystem
图像文本分析技术和通常的文本图像分析技术并不是完全独立的,它们之间有着紧密的联系。图像文本分析技术的最大特点就是,其所要处理的对象是具有复杂背景的一
上海交通大学硕士学位论文第一章:绪 …… 此处隐藏:2826字,全部文档内容请下载后查看。喜欢就下载吧 ……
相关推荐:
- [教育文库]夜场KTV服务员的岗位职责及工作流程[1]
- [教育文库]企划、网络、市场绩效考核方案
- [教育文库]学党史、知党情、强党性--“党的基本理
- [教育文库]2016年高考物理大一轮总复习(江苏专版
- [教育文库]干部廉洁自律自查自纠的报告
- [教育文库]2010年北京大学心理学系拟录取硕士研究
- [教育文库]资金时间价值练习题及答案
- [教育文库]保护环境的心得体会
- [教育文库]英语角内容:英语趣味小知识
- [教育文库]档案收集与管理工作通知
- [教育文库]劳动规章制度范本范本
- [教育文库]高考物理一轮复习课后限时作业1运动的
- [教育文库]机械工艺夹具毕业设计195推动架设计说
- [教育文库]通用技术教学比赛说课稿2
- [教育文库]2018年四年级英语下册 Module 7 Unit 2
- [教育文库]第2章 宽带IP网络的体系结构
- [教育文库]九年级化学第五单元课题3《根据化学方
- [教育文库]小学英语六年级情态动词用法归纳
- [教育文库]甲级单位编制窑井盖项目可行性报告(立
- [教育文库]2016-2021年中国城市规划行业全景调研
- 高考英语听力十大场景词汇总结
- 全省领导班子思想政治建设座谈会会议精
- 人教版新课标高一英语提优竞赛试题 下
- 江西省2014年生物中考试题
- 长沙镇食品药品安全事故应急预案
- 《金刚石、石墨和C60》片段教学设计
- 福州教育学院(王旭东)
- 基于EDA音乐播放器的设计
- 9、古诗两首《夜书所见》《九月九日忆
- 小学语文课外阅读有效策略探讨
- 贵州文化产业发展成支柱产业的问卷调查
- 膀胱类癌的诊治体会(附3例报告)
- 发动机积碳产生的原因
- Configuring Code Composer Studio for
- 学生良好的心理素质如何培养点滴谈
- 46 电沉积法制备锂离子电池用硅-锂薄膜
- 美舍雅阁公司管理中各部门职责
- 去壳剥皮的小妙招
- 六自由度运动平台的仿真研究
- Pride and Prejudice(傲慢与偏见)




