第八章 自然语言理解
学习人工智能的时候用道德一些文件!
第八章 自然语言理解
语言理解和处理是人工智能早期的和活跃的研究领域之一。由于它的难度很大,至今仍
未能达到很高的水平。
本章将首先讨论自然语言理解的概念、发展简史以及系统组成与模型等;然后,逐一研
究语言的自动分析、句子的自动理解、语言的自动生成、机器翻译和语音识别等重要问题;
最后举例介绍自然语言理解系统。
8.1 语言及其理解的一般问题
什么是语言和语言理解?自然语言理解与人类的哪些智能有关?自然语言理解研究是如
何发展的?理解自然语言的计算机系统是如何组成的以及它们的模型为何?等等。这些问题是
我们开始研究自然语言理解时感兴趣的。
8.1.1 语言和语言理解
语言是用于传递信息的表示方法、约定和规则的集合,它由语句组成,每个语句又由单
词组成;组成语句和语言时,应遵循一定的语法与语义规则。如果没有各种口语和书面语,
如英语、华语、法语和德语等,人类之间的充分和有效交流就难以想象。语言是随着人类社
会和人类自身的发展而不断进化的。现代语言允许任何一个具有正常语言能力的人与他人交
流思想感情和技术等。
要研究自然语言理解,首先必须对自然语言的构成有个基本认识。
语言是音义结合的词汇和语法体系,是实现思维活动的物质形式。语言是一个符号体系,
但与其他符号体系又有所区别。
语言是以词为基本单位的,词汇又受到语法的支配才可构成有意义的和可理解的句子,
句子按一定的形式再构成篇章等。词汇又可分为词和熟语。熟语就是一些词的固定组合,如
汉语中的成语。词又由词素构成,"教师"是由"教"和"师"这两个词素所构成的。词素是构成
词的最小的有意义的单位。"教"这个词素本身有教育和指导的意义,"师"则包含了"人"的意
义。
语法是语言的组织规律。语法规则制约着如何把词素构成词,词构成词组和句子。语言
正是在这种严密的制约关系中构成的。用词素构成词的规则叫构词规则,如教+师-→教师。
一个词又有不同的词形、单数、复数、阴性、阳性等等。这种构造词形的规则称为构形法,
如教师+们-→教师们。这里只是在原来的词后面加上一个复数意义的词素,所构成的并不是
一个新的词,而是同一词的复数形式。构形法和构词法称为词法。
词法中的另一部分就是句法。句
法也可分成两部分:词组构造法和造
句法。词组构造法是词搭配成词组的
规则,如红+铅笔-→红铅笔。这里"红
"是一个修饰铅笔的形容词,它与名词
"铅笔"组合成了一个新的名词。造句
法则是用词或词组造句的规则,"我是
计算机科学系的学生",这是按照汉语
造句法构造的句子。图8.1就是上述构
造的一个完整的图解。
另一方面,语言是音义结合的,8.1 语言的构成
学习人工智能的时候用道德一些文件!
每个词
汇有其语音形式。一个词的发音由一个或多个音节组合而成,音节又由音素构成,音素分为
元音音素和辅音音素。音素是指一个发音动作所构成的最小的语音单位。
迄今为止,对语言理解尚无统一的和权威的定义。按照考虑问题的角度不同而有不同的
解释。从微观上讲,语言理解是指从自然语言到机器(计算机系统)内部之间的一种映射。从
宏观上看,语言理解是指机器能够执行人类所期望的某些语言功能。这些功能包括:(1)回
答有关提问;(2)提取材料摘要;(3)不同词语叙述;(4)不同语言翻译。
然而,对自然语言的理解却是一个十分艰难的任务。即使建立一个只能理解片言断语的
计算机系统,也是很不容易的。这中间有大量的极为复杂的编码和解码问题。一个能够理解
自然语言的计算机系统就像一个人那样需要上下文知识以及根据这些知识和信息进行推理
的过程。自然语言不仅有语义、语法和语音问题,而且还存在模糊性等问题。具体地说,自
然语言理解的困难是由下列3个因素引起的:(1)目标表示的复杂性;(2)映射类型的多样性;
(3)源表达中各元素间交互程度的差异性。
自然语言理解是语言学、逻辑学、生理学、心理学、计算机科学和数学等相关学科发展
和结合而形成的一门交叉学科;它能够理解口头语言或书面语言。语言交流是一种基于知识
的通信。
8.1.2 自然语言理解研究的进展
计算机的出现使得自然语言理解研究成为可能,随着计算机技术和人工智能总体技术的
发展,自然语言理解不断取得进展。机器翻译是自然语言理解最早的研究领域。美苏两国在
1949年开始俄-英和英-俄文字的机器翻译研究。由于早期研究中理论和技术的局限,所开发
的机译系统的技术水平较低,不能满足实际应用的要求。
到了70年代初期,对语言理解对话系统的研究取得进展。伍兹(Woods)的LUNAR系统、
威诺甘德(Winogand)的SHRDLU系统和香克(Schank)的MARGIE系统等是语言理解对话系
统的典型实例。其中,SHRDLU系统是一个限定性的人机对话系统,它把句法、语义、推
理、上下文和背景知识灵活地结合于一体,成功地实现了人-机对话,并被用于指挥机器人
的积木分类和堆迭试验。机器人系统能够接受人的自然语言指令,进行积木的堆迭操作,并
能回答或者提出比较简单的问题。
进入80年代之后,自然语言理解的应用研究广泛开展,机器学习研究又十分活跃,并
出现了许多具有较高水平的实用化系统。其中比较著名的有美国的METAL和LOGOS,日
本的PIVOT和HICAT,法国的ARIANE以及德国的SUSY等系统;这些系统是自然语言
理解研究的重要成果,表明自然语言理解在理论上和应用上取得了突破性进展。80年代以
来提出和进行的智能计算机研究,也对自然语言理解提出了新的要求。近年来又提出了对多
媒体计算机的研究。新型的智能计算机和多媒体计算机均要求设计出更为友好的人机界面,
使自然语言、文字、图象和声音等信号都能直接输入计算机。要求计算机能以自然语言与人
进行对话交流,就需要计算机具有自然语言能力,尤其是口语理解和生成能力。
口语理解研究促进人机对话系统走向实用化。自然语言是表示知识最为直接的方法。因
此,自然语言理解的研究也为专家系统的知识获取提供了新的途径。此外,自然语言理解的
研究已促进计算机辅助语言教学(CALI)和计算机语言设计(CLD)等的发展。可以预料,进入
21世纪之后,自然语言理解的研究有可能取得新的突破,并获得广泛应用。
8.1.3 自然语言理解过程的层次
语言虽然表示成一连串的文字符号或者一串声音流,但其内部事实上是一个层次化的结
构,从语言的构成中就可以清楚的看到这种层次性。一个文字表达的句子是由词素-→词或
学习人工智能的时候用道德一些文件!
词形-→词组或句子,而用声音表达的句子则是由音素-→音节-→音词-→音句,其中每个层
次都是受到语法规则的制约。因此,语言的分析和理解过程也应当是一个层次化的过程。许
多现代语言学家把这一过程分为5个层次:语音分析、词法 …… 此处隐藏:2781字,全部文档内容请下载后查看。喜欢就下载吧 ……
相关推荐:
- [初中教育]婚姻家庭法学教学教案
- [初中教育]浅谈小学语文教学中的创新教育
- [初中教育]中华人民共和国侵权责任法2009
- [初中教育]2016-2022年中国薄膜太阳能电池行业发
- [初中教育]多级轻型井点降水的应用
- [初中教育]外语教学法流派介绍和简评
- [初中教育]实验一、典型环节及其阶跃响应
- [初中教育]内蒙古2012-2013学年度国家奖学金获奖
- [初中教育]移动通信营销渠道管理探讨
- [初中教育]初三化学第一学期第一第二章基础知识点
- [初中教育]一天的食物教学设计
- [初中教育]光导照明系统的基本结构及工作原理
- [初中教育]长春市十一高、东北师范大学附属中学、
- [初中教育]“十三五”规划重点-配重式装卸车项目
- [初中教育]领导方法和领导艺术
- [初中教育]第三章 植物病虫草鼠害诊断与防治基
- [初中教育]2019届九年级语文上册 第二单元 6纪念
- [初中教育]甲级单位编制水豆腐项目可行性报告(立
- [初中教育]Ch8-1补充 09101数据库系统原理及应用-
- [初中教育]2017-2023年中国吊装设备行业市场分析
- 制作毕业纪念册需要哪些材料
- 2015-2016学年高二化学苏教版选修4课件
- 哈佛管理导师-创建商业案例
- 职场交际中的谈吐礼仪知识与职场会议接
- 中国糕点及面包行业发展现状与竞争战略
- 沂河“12·7”洪水茶山拦河坝
- 管道水流量计算公式
- 4-2发电机火灾事故处置方案
- 数字信号处理实验五
- 2009年经济师(中级)金融专业知识全真试
- 历史街区保护规划--04历史文化遗产保护
- 宁夏回族自治区中小学职称评价标准
- 评先评优测评表
- 圆的切线证明及线段长求解在在中考中的
- 【解析版】2015年江苏省南京外国语学校
- 人教版八年级上册科学第一章习题精华
- 责任心与执行力
- SA8000社会责任管理体系标准培训
- IgA肾病的饮食应注意
- 杭州市建设工程文件归档整理方案(试行)