第八章 自然语言理解(2)
,但接下来的swallow就找不到合适的弧了。此时对应于这个路径,该句子就被拒识了。由此
表 8.1 句子识别过程
图 8.4 TN分析树
1.并行算法
并行算法的关键是在任何一个状态都要选择所有可以到达下一个状态的弧,同时进行试
验。
2.回溯算法
回溯算法则是在所有可以通过的弧中选出一条往下走,并保留其他的可能性,以便必要
时可回过来选择之。这种方式需要一个堆栈结构。
8.2.2 扩充转移网络
扩充转移网络ATN是由伍兹(Woods)在1970年提出的,1975年卡普兰( Kaplan)对其作
了一些改进。ATN是由一组网络所构成的,每个网络都有一个网络名,每条弧上的条件扩
展为条件加上操作。这种条件和操作采用寄存器的方法来实现,在分析树的各个成分结构上
都放上寄存器,用来存放句法功能和句法特征,条件和操作将对它们不断地进行访问和设置。
ATN弧上的标记也可以是其他网络的标记名,因此ATN是一种递归网络。在ATN中还有
一种空弧jump,它不对应一个句法成分也不对应一个输入词汇。
ATN的每个寄存器由两部分构成:句法特征寄存器和句法功能寄存器。在特征寄存器
中,每一维特征都有一个特征名和一组特征值,以及一个缺省值来表示。如"数"的特征维可
有两个特征值"单数"和"复数",缺省值可以是空值。英语中动词的形式可以用一维特征来表
示:
Form:present,past,present-participle,past-participle.Default:present.
功能寄存器则反映了句法成分之间的关系和功能。
分析树的每个节点都有一个寄存器,寄存器的上半部分是特征寄存器,下半部分是功能
寄存器。图8.5所示是一个简单的名词短语(NP)的扩充转移网络,网络中弧上的条件和操作
如下:
学习人工智能的时候用道德一些文件!
NP-1:f
A:Number
NP-4:gNoung *Number h
C:Number=* Number or φ
A:Number
图 8.5 名词短语(NP)的扩充转移网络 * Number NP-5:fpronounh A:Number*Number NP-6:fproperh
C:Number=* Number or φ
该网络主要是用来检查NP中的数的一致值问题。其中用到的特征是Number(数),它有
两个值Singular(单数)和plural(复数),缺省值是φ(空)。C是弧上的条件,A是弧上的操作,
*是当前词,proper是专用名词,Det是限定词,PP是介词短语,*Number当前词的"数"。
该扩充转移网络有一个网络名NP。网络NP可以是其他网络的一个子网络,也可包含其他
网络,如其中的PP就是一个子网络,就这是网络的递归性。弧NP-1将当前词的Number
放入当前NP的Number中,而弧NP-4则要求当前noun的Number与
NP的Number是相同
时,或者NP的Number为空时,将noun作为NP的Number,这就要求det的数和noun的
数是一致的。因此,this book,the book,thebooks,these books都可顺利通过这一网络,但
是this books,或these book就无法通过。如果当前NP是一个代词(Pron.)或者专用名词
(Proper),那么网络就从NP-5或NP-6通过,这时NP的数就是代词或专用名词的数。PP是
一个修饰前面名词的介词短语,一旦到达PP弧就马上转入子网络PP。
图 8.6 句子的扩充转移网络
图8.6是一个句子的ATN,主要用来识别主、被动态的句子,从中可以看到功能寄存
器的应用。S网络中所涉及的功能名和特征维包括:
功能名: Subject(主语),Direct Obj(直接宾语),
Main-Verb(谓语动词) Auxs(助动词), Modifiers(修饰语)。
特征维: Voice(语态):Active(主动态),Passive(被动态),缺省 值是Actire Type(动词类型):
Type(动词类型):Be,Do,Have,Modal,Non-Aux,缺省值是 Non-Aux。
Form(动词式):Inf(不定式),Present(现在式),Past(过
去式),pres-part(现在分词),Past-Part(过去分词),缺省
值是Present。
当然作为一完整的ATN是相当复杂的,在实现过程中还必须解决许多问题,如非
学习人工智能的时候用道德一些文件!
确定性分析、弧的顺序、非直接支配关系的处理等等。ATN方法在自然语言理解的研究中
得到了广泛的应用
8.2.3 词汇功能语法(LFG)
词汇功能语法是由卡普兰和布鲁斯南(Bresnan)在1982年提出的,它是一种功能语法,
但是更加强调词汇的作用。LFG用一种结构来表达特征、功能、词汇和成分的顺序。ATN
语法和转换语法都是有方向性的,ATN语法的条件和操作要求语法的使用是有方向的,因
为寄存器只有在被设置过之后才可被访问。LFG的一个重要工作就是通过互不矛盾的多层
描述来消除这种有序性限制。
LFG对句子的描述分为两部分:直接成分结构(Constituent Structure,简称C-Structure)和
功能结构(Functional Structure,简称F-structure),C-structure是由上下文无关语法产生的表层
分析结果。在此基础上经一系列代数变换产生F-structure。LFG采用两种规则:加入下标的
上下文无关语法规则和词汇规则。表8.2给出了一些词汇功能语法的规则和词条,其中↑表
示当前成分的上一层次的直接成分,如规则中NP的↑就是S,VP的↑也是S;↓则表示当前
成分。因此,(↑Subject)=↓就表示S的主语是当前NP。"<>"中表达的是句法模式,'Hand=
<(↑Subject),(↑Object),(↑Object-2)>,表示谓语动词hand要有一个主语、一个直接宾语和
一个间接宾语。
表 8.2 LFG语法与词典
用LFG语法对句子进行分析的过程如下:
(1)用上下文无关语法分析获得C-structure,不考虑语法中的下标;该C-structure就是
一棵直接成分树;
(2)将各个非叶节点定义为变量,根据词汇规则和语法规则中的下标,建立功能描述(一
组方程式);
(3)对方程式作代数变换,求出各个变量,获得功能结构F-structure。
上述过程如果能够得到一组以上解,则句子就是可识别的,并获得一个以上分析结果。
分析获得多个解则说明原句子中存在着歧义现象,无解则说明无法识别。图8.7就是句子A
girl handed her baby the toys的分析过程。方程的建立只要将↑用父节点变量来替代,↓用当前
节点来代替即可。规则S→NP VP的下标有两组:一是(↑Subject)=↓,替换得到(x1∨
Subject)=x2;另一是↑=↓即x1=x3。方程式(x1∨Subject)=x2的意义就是"x1的主语是x2",
因此,上面两个方程式直接可用方程变换得到x1=x3=[Subject=x2]。在词汇规则中,词a对
学习人工智能的时候用道德一些文件!
应了两条规则(↑Definiteness)=Indefinite,(↑Number)=Singular,词a的父节点就是NP,即x2,
所以得到方程式(x2Definiteness)=Indefinite,(x2Number)= Singular。上述方程式通过解的合并
和替代最终就可以获得图8.7中的F-structure。
LFG同样也可以用于句子的生成。分析和生成的区别仅在于第一步,分析是由句子到
C-structure,而生成则是由上下文无关语法直接产生C-structure和句子。同样如果通过求解最
终可有一个以上的解,则该句子就是 …… 此处隐藏:3161字,全部文档内容请下载后查看。喜欢就下载吧 ……
相关推荐:
- [初中教育]婚姻家庭法学教学教案
- [初中教育]浅谈小学语文教学中的创新教育
- [初中教育]中华人民共和国侵权责任法2009
- [初中教育]2016-2022年中国薄膜太阳能电池行业发
- [初中教育]多级轻型井点降水的应用
- [初中教育]外语教学法流派介绍和简评
- [初中教育]实验一、典型环节及其阶跃响应
- [初中教育]内蒙古2012-2013学年度国家奖学金获奖
- [初中教育]移动通信营销渠道管理探讨
- [初中教育]初三化学第一学期第一第二章基础知识点
- [初中教育]一天的食物教学设计
- [初中教育]光导照明系统的基本结构及工作原理
- [初中教育]长春市十一高、东北师范大学附属中学、
- [初中教育]“十三五”规划重点-配重式装卸车项目
- [初中教育]领导方法和领导艺术
- [初中教育]第三章 植物病虫草鼠害诊断与防治基
- [初中教育]2019届九年级语文上册 第二单元 6纪念
- [初中教育]甲级单位编制水豆腐项目可行性报告(立
- [初中教育]Ch8-1补充 09101数据库系统原理及应用-
- [初中教育]2017-2023年中国吊装设备行业市场分析
- 制作毕业纪念册需要哪些材料
- 2015-2016学年高二化学苏教版选修4课件
- 哈佛管理导师-创建商业案例
- 职场交际中的谈吐礼仪知识与职场会议接
- 中国糕点及面包行业发展现状与竞争战略
- 沂河“12·7”洪水茶山拦河坝
- 管道水流量计算公式
- 4-2发电机火灾事故处置方案
- 数字信号处理实验五
- 2009年经济师(中级)金融专业知识全真试
- 历史街区保护规划--04历史文化遗产保护
- 宁夏回族自治区中小学职称评价标准
- 评先评优测评表
- 圆的切线证明及线段长求解在在中考中的
- 【解析版】2015年江苏省南京外国语学校
- 人教版八年级上册科学第一章习题精华
- 责任心与执行力
- SA8000社会责任管理体系标准培训
- IgA肾病的饮食应注意
- 杭州市建设工程文件归档整理方案(试行)