教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 文库大全 > 初中教育 >

第八章 自然语言理解(2)

来源:网络收集 时间:2025-09-17
导读: ,但接下来的swallow就找不到合适的弧了。此时对应于这个路径,该句子就被拒识了。由此 表 8.1 句子识别过程 图 8.4 TN分析树 1.并行算法 并行算法的关键是在任何一个状态都要选择所有可以到达下一个状态的弧,同时

,但接下来的swallow就找不到合适的弧了。此时对应于这个路径,该句子就被拒识了。由此

表 8.1 句子识别过程

图 8.4 TN分析树

1.并行算法

并行算法的关键是在任何一个状态都要选择所有可以到达下一个状态的弧,同时进行试

验。

2.回溯算法

回溯算法则是在所有可以通过的弧中选出一条往下走,并保留其他的可能性,以便必要

时可回过来选择之。这种方式需要一个堆栈结构。

8.2.2 扩充转移网络

扩充转移网络ATN是由伍兹(Woods)在1970年提出的,1975年卡普兰( Kaplan)对其作

了一些改进。ATN是由一组网络所构成的,每个网络都有一个网络名,每条弧上的条件扩

展为条件加上操作。这种条件和操作采用寄存器的方法来实现,在分析树的各个成分结构上

都放上寄存器,用来存放句法功能和句法特征,条件和操作将对它们不断地进行访问和设置。

ATN弧上的标记也可以是其他网络的标记名,因此ATN是一种递归网络。在ATN中还有

一种空弧jump,它不对应一个句法成分也不对应一个输入词汇。

ATN的每个寄存器由两部分构成:句法特征寄存器和句法功能寄存器。在特征寄存器

中,每一维特征都有一个特征名和一组特征值,以及一个缺省值来表示。如"数"的特征维可

有两个特征值"单数"和"复数",缺省值可以是空值。英语中动词的形式可以用一维特征来表

示:

Form:present,past,present-participle,past-participle.Default:present.

功能寄存器则反映了句法成分之间的关系和功能。

分析树的每个节点都有一个寄存器,寄存器的上半部分是特征寄存器,下半部分是功能

寄存器。图8.5所示是一个简单的名词短语(NP)的扩充转移网络,网络中弧上的条件和操作

如下:

学习人工智能的时候用道德一些文件!

NP-1:f

A:Number

NP-4:gNoung *Number h

C:Number=* Number or φ

A:Number

图 8.5 名词短语(NP)的扩充转移网络 * Number NP-5:fpronounh A:Number*Number NP-6:fproperh

C:Number=* Number or φ

该网络主要是用来检查NP中的数的一致值问题。其中用到的特征是Number(数),它有

两个值Singular(单数)和plural(复数),缺省值是φ(空)。C是弧上的条件,A是弧上的操作,

*是当前词,proper是专用名词,Det是限定词,PP是介词短语,*Number当前词的"数"。

该扩充转移网络有一个网络名NP。网络NP可以是其他网络的一个子网络,也可包含其他

网络,如其中的PP就是一个子网络,就这是网络的递归性。弧NP-1将当前词的Number

放入当前NP的Number中,而弧NP-4则要求当前noun的Number与

NP的Number是相同

时,或者NP的Number为空时,将noun作为NP的Number,这就要求det的数和noun的

数是一致的。因此,this book,the book,thebooks,these books都可顺利通过这一网络,但

是this books,或these book就无法通过。如果当前NP是一个代词(Pron.)或者专用名词

(Proper),那么网络就从NP-5或NP-6通过,这时NP的数就是代词或专用名词的数。PP是

一个修饰前面名词的介词短语,一旦到达PP弧就马上转入子网络PP。

图 8.6 句子的扩充转移网络

图8.6是一个句子的ATN,主要用来识别主、被动态的句子,从中可以看到功能寄存

器的应用。S网络中所涉及的功能名和特征维包括:

功能名: Subject(主语),Direct Obj(直接宾语),

Main-Verb(谓语动词) Auxs(助动词), Modifiers(修饰语)。

特征维: Voice(语态):Active(主动态),Passive(被动态),缺省 值是Actire Type(动词类型):

Type(动词类型):Be,Do,Have,Modal,Non-Aux,缺省值是 Non-Aux。

Form(动词式):Inf(不定式),Present(现在式),Past(过

去式),pres-part(现在分词),Past-Part(过去分词),缺省

值是Present。

当然作为一完整的ATN是相当复杂的,在实现过程中还必须解决许多问题,如非

学习人工智能的时候用道德一些文件!

确定性分析、弧的顺序、非直接支配关系的处理等等。ATN方法在自然语言理解的研究中

得到了广泛的应用

8.2.3 词汇功能语法(LFG)

词汇功能语法是由卡普兰和布鲁斯南(Bresnan)在1982年提出的,它是一种功能语法,

但是更加强调词汇的作用。LFG用一种结构来表达特征、功能、词汇和成分的顺序。ATN

语法和转换语法都是有方向性的,ATN语法的条件和操作要求语法的使用是有方向的,因

为寄存器只有在被设置过之后才可被访问。LFG的一个重要工作就是通过互不矛盾的多层

描述来消除这种有序性限制。

LFG对句子的描述分为两部分:直接成分结构(Constituent Structure,简称C-Structure)和

功能结构(Functional Structure,简称F-structure),C-structure是由上下文无关语法产生的表层

分析结果。在此基础上经一系列代数变换产生F-structure。LFG采用两种规则:加入下标的

上下文无关语法规则和词汇规则。表8.2给出了一些词汇功能语法的规则和词条,其中↑表

示当前成分的上一层次的直接成分,如规则中NP的↑就是S,VP的↑也是S;↓则表示当前

成分。因此,(↑Subject)=↓就表示S的主语是当前NP。"<>"中表达的是句法模式,'Hand=

<(↑Subject),(↑Object),(↑Object-2)>,表示谓语动词hand要有一个主语、一个直接宾语和

一个间接宾语。

表 8.2 LFG语法与词典

用LFG语法对句子进行分析的过程如下:

(1)用上下文无关语法分析获得C-structure,不考虑语法中的下标;该C-structure就是

一棵直接成分树;

(2)将各个非叶节点定义为变量,根据词汇规则和语法规则中的下标,建立功能描述(一

组方程式);

(3)对方程式作代数变换,求出各个变量,获得功能结构F-structure。

上述过程如果能够得到一组以上解,则句子就是可识别的,并获得一个以上分析结果。

分析获得多个解则说明原句子中存在着歧义现象,无解则说明无法识别。图8.7就是句子A

girl handed her baby the toys的分析过程。方程的建立只要将↑用父节点变量来替代,↓用当前

节点来代替即可。规则S→NP VP的下标有两组:一是(↑Subject)=↓,替换得到(x1∨

Subject)=x2;另一是↑=↓即x1=x3。方程式(x1∨Subject)=x2的意义就是"x1的主语是x2",

因此,上面两个方程式直接可用方程变换得到x1=x3=[Subject=x2]。在词汇规则中,词a对

学习人工智能的时候用道德一些文件!

应了两条规则(↑Definiteness)=Indefinite,(↑Number)=Singular,词a的父节点就是NP,即x2,

所以得到方程式(x2Definiteness)=Indefinite,(x2Number)= Singular。上述方程式通过解的合并

和替代最终就可以获得图8.7中的F-structure。

LFG同样也可以用于句子的生成。分析和生成的区别仅在于第一步,分析是由句子到

C-structure,而生成则是由上下文无关语法直接产生C-structure和句子。同样如果通过求解最

终可有一个以上的解,则该句子就是 …… 此处隐藏:3161字,全部文档内容请下载后查看。喜欢就下载吧 ……

第八章 自然语言理解(2).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wenku/46794.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)