第八章自然语言理解(3)

来源：网络收集时间：2026-06-05

导读：时态信息可采用另一个映射规则： (S TENSE past)→(PAST ? ?) 合并上述的映射就可最终获得逻辑形式表示： (PAST r1 RUN1 [AGENT(DEF/SING m1 MAN)]) 学习人工智能的时候用道德一些文件! 这里只是一个简单的例子。在

时态信息可采用另一个映射规则：

(S TENSE past)→(PAST ? ?)

合并上述的映射就可最终获得逻辑形式表示：

(PAST r1 RUN1 [AGENT(DEF/SING m1 MAN)])

学习人工智能的时候用道德一些文件!

这里只是一个简单的例子。在规则的应用中，还需要有很多的解析策略。

8.3 语言理解

句子一般有简单句和复合句之分。简单句的理解比复合句要容易，又是理解复合句的基

础。因此，我们首先讨论简单句的理解，然后讨论复合句的理解。

8.3.1. 简单句的理解方法

由于简单句是可以独立存在的，因而为了理解一个简单句，即建立起一个和该简单句相

对应的机内表达，需要做以下两方面的工作：

(1) 理解语句中的每一个词。

(2) 以这些词为基础组成一个可以表达整个语句意义的结构。

第一项工作看起来很容易，似乎只是查一下字典就可以解决。而实际上由于许多单词有

不止一种含义，因而只由单词本身往往不能确定其在句中的确切含义，需要通过语法分析和

上下关系等才能最终确定。例如，单词diamond有"菱形"、"棒球场"和"钻石"三种意思，在

语句"John saw Susan′s diamond shimmering from across the room." 中，由于"shimmering"的出

现，则显然"diamond"是"钻石"的含义，因为"菱形"和"棒球场"都不会闪光。再如在语句"I′ll

meet you at the diamond." 中，由于"at"后面需要一个时间或地点名词作为它的宾语，因而显

然这里的"diamond"是"棒球场"的含义，而不能是其它含义。

第二项也是一个比较困维的工作。因为要联合单词来构成表示一个句子意义的结构，需

要依赖各种信息源，其中包括所用语言的知识、语句所涉及领域的知识以及有关该语言使用

者应共同遵守的习惯用法的知识。由于这个解释过程涉及到许多事情，因而常常将这项工作

分成以下3个部分来进行：

句法分析将单词之间的线性次序变换成一个显示单词如何与其它单词相关联的结构。

语义分析各种意义被赋于由句法分析程序所建立的结构，即在句法结构和任务领域内

对象之间进行映射变换。

语用分析为确定真正含义，对表达的结构重新加以解释。

实际上这3个阶段之间是相互关联的，总是以各种方法相互影响着。尽管在某种程度上

把它们分开是有效的，但绝对分开是不可能的。

1.关键字匹配法

最简单的自然语言理解方法，也许要算是关键字匹配法了，它在一些特定场合下是有效

的。其方法简单归纳起来是这样的：在程序中规定匹配和动作两种类型的样本。然后建立一

种由匹配样本到动作样本的映射。当输入语句与匹配样本相匹配时，就去执行相应样本所规

定的动作，这样从外表看来似乎机器真正实现了能理解用户问话的目的。例如在一个列车运

行数据库系统中，规定了以下几个匹配样本：

(a) 从<处所>到<处所>有<车种>吗?

(b) 从<处所>到<处所>有<? 数量><车种>?

(d) <车次>在<处所>停吗?

(e) <车次>经过<处所>吗?

(f) <车次>有<车组>吗?

(g) 到<处所>的<车种>都有<车组>吗?

(h) <车次><? 原因>没有<车组>?

(i) <车次><? 原因>有<车组>?

(j) <车次><? 时刻>从<处所>开出?

(k) <车次><? 时刻>到达<处所>?

(l) 从<处所>到<处所><?指数量><车次>最快?

学习人工智能的时候用道德一些文件!

其中，<…>可与任何具有规定特性的单词匹配，如<处所>可以和"北京"、"上海"等表示

地点的单词匹配；<车种>可以和"特快"、"直快"等匹配；<?数量>可与"几趟"等匹配；<?指

数量>可与"哪几趟"等匹配；<车组>可与"餐车"、"卧铺"等匹配，<?原因>可与"为什么"、"

怎么"等匹配；<?时刻>可与"什么时候"、"几点"等匹配。

如果你输入

从北京到上海有特快吗?

该语句刚好与第一个匹配样本相匹配，从而系统也就"理解"了你的问话，并去检索数据库，

查看从北京到上海是否有特快，然后给出回答。

这种关键字匹配的方法，在类似的数据库咨询系统中作为自然语言接口，显得特别有效，

虽然它不具有任何意义下的理解。

2.句法分析树法

关键字匹配法虽然简单，但却忽略了语句中的大量信息，为确保语句含义的细节不被忽

略，必须确定其语句结构上的细节，这就是要进行文法分析。为此，必须首先给出说明该特

定语言中符号串结构的文法，以便为每个符合文法规则的语句产生一个称为文法分析树的结

构。

关于文法的形式，在许多自然语言处理程序中提出过很多各不相同的定义，作为一个例

子，下面我们给出一种文法的形式化定义。

文法G在其形式上为如下的四元组：

G=(V,Σ，P，S)

其中，V为有穷非空集，称作总词汇表；Σ为V的一个非空子集，称作终结字母表，而N=V-Σ

称作非终结字母表；P为如下形式的有穷产生式集：

α→β

式中，α∈Ｖ*NV*，β∈V*，*表示它前面的字符可以重复出现任意次；S为非终结字母表的

一个元素，称为起始符。下面给出的是一个英语子集的简单文法：

ADJS

VPNP VP the NP1 NP1 ∈｜ADJ V

V NP

Joe｜boy｜ball

little｜dig

hit｜ran VP N

图 8.8 文法分析树示例 ADJ V 其中，大写的是非终结符，

而小写的是终结符，

∈表示空字符串。

图8.8是使用该文法对语句“Joe hit the ball.”进行句法分析而建立的文法分析树。

使用给定文法，对输入语句进行分析找到一个文法分析树的过程，可以看成是一个搜索

过程。为实现该过程，可以使用自顶向下的处理方法，这和正向推理有些相象，它首先从起

始符开始，然后应用P中的规则，一层一层地向下产生树的各个分支，直到一个完整的句

子结构被生成出来为止。如果该结构与输入语句相匹配，则成功结束；否则，便从顶层重新

开始，生成其它的句子结构，直到结束为止。也可以使用自底向上的处理方法，这和逆向推

理有些相象，它以输入语句的词为基础，首先从P中查找规则，试图把这些词归并成较大

学习人工智能的时候用道德一些文件!

的结构成分，如短语或子句等，然后再对这些成分进行进一步的组合，反向生成文法分析树，

直到树的根节点是起始符为止。

不管使用哪种处理方法，都要遇到象词性选择这类的问题，比如can这个词，既可以是

助动词，又可以是名词，对于这样的从多重选择中作出判断的问题，可以使用与搜 …… 此处隐藏：2351字，全部文档内容请下载后查看。喜欢就下载吧 ……

第八章自然语言理解(3).doc 将本文的Word文档下载到电脑，方便复制、编辑、收藏和打印

下载这篇word文档

本文链接：https://www.jiaowen.net/wenku/46794.html（转载请注明文章来源）

上一篇：高中数学__选修2-1 1.1命题及其关系
下一篇：十月有奖征文：歌颂祖国

第八章 自然语言理解(3)

第八章自然语言理解(3)