第八章 自然语言理解(3)
时态信息可采用另一个映射规则:
(S TENSE past)→(PAST ? ?)
合并上述的映射就可最终获得逻辑形式表示:
(PAST r1 RUN1 [AGENT(DEF/SING m1 MAN)])
学习人工智能的时候用道德一些文件!
这里只是一个简单的例子。在规则的应用中,还需要有很多的解析策略。
8.3 语言理解
句子一般有简单句和复合句之分。简单句的理解比复合句要容易,又是理解复合句的基
础。因此,我们首先讨论简单句的理解,然后讨论复合句的理解。
8.3.1. 简单句的理解方法
由于简单句是可以独立存在的,因而为了理解一个简单句,即建立起一个和该简单句相
对应的机内表达,需要做以下两方面的工作:
(1) 理解语句中的每一个词。
(2) 以这些词为基础组成一个可以表达整个语句意义的结构。
第一项工作看起来很容易,似乎只是查一下字典就可以解决。而实际上由于许多单词有
不止一种含义,因而只由单词本身往往不能确定其在句中的确切含义,需要通过语法分析和
上下关系等才能最终确定。例如,单词diamond有"菱形"、"棒球场"和"钻石"三种意思,在
语句"John saw Susan′s diamond shimmering from across the room." 中,由于"shimmering"的出
现,则显然"diamond"是"钻石"的含义,因为"菱形"和"棒球场"都不会闪光。再如在语句"I′ll
meet you at the diamond." 中,由于"at"后面需要一个时间或地点名词作为它的宾语,因而显
然这里的"diamond"是"棒球场"的含义,而不能是其它含义。
第二项也是一个比较困维的工作。因为要联合单词来构成表示一个句子意义的结构,需
要依赖各种信息源,其中包括所用语言的知识、语句所涉及领域的知识以及有关该语言使用
者应共同遵守的习惯用法的知识。由于这个解释过程涉及到许多事情,因而常常将这项工作
分成以下3个部分来进行:
句法分析 将单词之间的线性次序变换成一个显示单词如何与其它单词相关联的结构。
语义分析 各种意义被赋于由句法分析程序所建立的结构,即在句法结构和任务领域内
对象之间进行映射变换。
语用分析 为确定真正含义,对表达的结构重新加以解释。
实际上这3个阶段之间是相互关联的,总是以各种方法相互影响着。尽管在某种程度上
把它们分开是有效的,但绝对分开是不可能的。
1.关键字匹配法
最简单的自然语言理解方法,也许要算是关键字匹配法了,它在一些特定场合下是有效
的。其方法简单归纳起来是这样的:在程序中规定匹配和动作两种类型的样本。然后建立一
种由匹配样本到动作样本的映射。当输入语句与匹配样本相匹配时,就去执行相应样本所规
定的动作,这样从外表看来似乎机器真正实现了能理解用户问话的目的。例如在一个列车运
行数据库系统中,规定了以下几个匹配样本:
(a) 从<处所>到<处所>有<车种>吗?
(b) 从<处所>到<处所>有<? 数量><车种>?
(c) 从<处所>到<处所>有<? 指数量><车种>?
(d) <车次>在<处所>停吗?
(e) <车次>经过<处所>吗?
(f) <车次>有<车组>吗?
(g) 到<处所>的<车种>都有<车组>吗?
(h) <车次><? 原因>没有<车组>?
(i) <车次><? 原因>有<车组>?
(j) <车次><? 时刻>从<处所>开出?
(k) <车次><? 时刻>到达<处所>?
(l) 从<处所>到<处所><?指数量><车次>最快?
学习人工智能的时候用道德一些文件!
其中,<…>可与任何具有规定特性的单词匹配,如<处所>可以和"北京"、"上海"等表示
地点的单词匹配;<车种>可以和"特快"、"直快"等匹配;<?数量>可与"几趟"等匹配;<?指
数量>可与"哪几趟"等匹配;<车组>可与"餐车"、"卧铺"等匹配,<?原因>可与"为什么"、"
怎么"等匹配;<?时刻>可与"什么时候"、"几点"等匹配。
如果你输入
从北京到上海有特快吗?
该语句刚好与第一个匹配样本相匹配,从而系统也就"理解"了你的问话,并去检索数据库,
查看从北京到上海是否有特快,然后给出回答。
这种关键字匹配的方法,在类似的数据库咨询系统中作为自然语言接口,显得特别有效,
虽然它不具有任何意义下的理解。
2.句法分析树法
关键字匹配法虽然简单,但却忽略了语句中的大量信息,为确保语句含义的细节不被忽
略,必须确定其语句结构上的细节,这就是要进行文法分析。为此,必须首先给出说明该特
定语言中符号串结构的文法,以便为每个符合文法规则的语句产生一个称为文法分析树的结
构。
关于文法的形式,在许多自然语言处理程序中提出过很多各不相同的定义,作为一个例
子,下面我们给出一种文法的形式化定义。
文法G在其形式上为如下的四元组:
G=(V,Σ,P,S)
其中,V为有穷非空集,称作总词汇表;Σ为V的一个非空子集,称作终结字母表,而N=V-Σ
称作非终结字母表;P为如下形式的有穷产生式集:
α→β
式中,α∈V*NV*,β∈V*,*表示它前面的字符可以重复出现任意次;S为非终结字母表的
一个元素,称为起始符。下面给出的是一个英语子集的简单文法:
S
NP
NP
ADJS
ADJS
VPNP VP the NP1 NP1 ∈|ADJ V
V NP
Joe|boy|ball
little|dig
hit|ran VP N
图 8.8 文法分析树示例 ADJ V 其中,大写的是非终结符,
而小写的是终结符,
∈表示空字符串。
图8.8是使用该文法对语句“Joe hit the ball.”进行句法分析而建立的文法分析树。
使用给定文法,对输入语句进行分析找到一个文法分析树的过程,可以看成是一个搜索
过程。为实现该过程,可以使用自顶向下的处理方法,这和正向推理有些相象,它首先从起
始符开始,然后应用P中的规则,一层一层地向下产生树的各个分支,直到一个完整的句
子结构被生成出来为止。如果该结构与输入语句相匹配,则成功结束;否则,便从顶层重新
开始,生成其它的句子结构,直到结束为止。也可以使用自底向上的处理方法,这和逆向推
理有些相象,它以输入语句的词为基础,首先从P中查找规则,试图把这些词归并成较大
学习人工智能的时候用道德一些文件!
的结构成分,如短语或子句等,然后再对这些成分进行进一步的组合,反向生成文法分析树,
直到树的根节点是起始符为止。
不管使用哪种处理方法,都要遇到象词性选择这类的问题,比如can这个词,既可以是
助动词,又可以是名词,对于这样的从多重选择中作出判断的问题,可以使用与搜 …… 此处隐藏:2351字,全部文档内容请下载后查看。喜欢就下载吧 ……
相关推荐:
- [初中教育]婚姻家庭法学教学教案
- [初中教育]浅谈小学语文教学中的创新教育
- [初中教育]中华人民共和国侵权责任法2009
- [初中教育]2016-2022年中国薄膜太阳能电池行业发
- [初中教育]多级轻型井点降水的应用
- [初中教育]外语教学法流派介绍和简评
- [初中教育]实验一、典型环节及其阶跃响应
- [初中教育]内蒙古2012-2013学年度国家奖学金获奖
- [初中教育]移动通信营销渠道管理探讨
- [初中教育]初三化学第一学期第一第二章基础知识点
- [初中教育]一天的食物教学设计
- [初中教育]光导照明系统的基本结构及工作原理
- [初中教育]长春市十一高、东北师范大学附属中学、
- [初中教育]“十三五”规划重点-配重式装卸车项目
- [初中教育]领导方法和领导艺术
- [初中教育]第三章 植物病虫草鼠害诊断与防治基
- [初中教育]2019届九年级语文上册 第二单元 6纪念
- [初中教育]甲级单位编制水豆腐项目可行性报告(立
- [初中教育]Ch8-1补充 09101数据库系统原理及应用-
- [初中教育]2017-2023年中国吊装设备行业市场分析
- 制作毕业纪念册需要哪些材料
- 2015-2016学年高二化学苏教版选修4课件
- 哈佛管理导师-创建商业案例
- 职场交际中的谈吐礼仪知识与职场会议接
- 中国糕点及面包行业发展现状与竞争战略
- 沂河“12·7”洪水茶山拦河坝
- 管道水流量计算公式
- 4-2发电机火灾事故处置方案
- 数字信号处理实验五
- 2009年经济师(中级)金融专业知识全真试
- 历史街区保护规划--04历史文化遗产保护
- 宁夏回族自治区中小学职称评价标准
- 评先评优测评表
- 圆的切线证明及线段长求解在在中考中的
- 【解析版】2015年江苏省南京外国语学校
- 人教版八年级上册科学第一章习题精华
- 责任心与执行力
- SA8000社会责任管理体系标准培训
- IgA肾病的饮食应注意
- 杭州市建设工程文件归档整理方案(试行)