教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 文库大全 > 初中教育 >

第八章 自然语言理解(4)

来源:网络收集 时间:2025-09-17
导读: 乘飞机应看成是出差的一部分。 (d) 与行动有关的事物,例如 学习人工智能的时候用道德一些文件! 李明决定骑车去商店。他走到车棚,可是发现他的自行车没气了。 李明的自行车应理解为是与他骑车去商店这一行动有关的

乘飞机应看成是出差的一部分。

(d) 与行动有关的事物,例如

学习人工智能的时候用道德一些文件!

"李明决定骑车去商店。他走到车棚,可是发现他的自行车没气了。"

李明的自行车应理解为是与他骑车去商店这一行动有关的事物。 (e) 因果关系,例如 "昨天有一场暴风雪。所以学校今天停课"。 下雪应理解为是停课的原因。

(f) 计划次序,例如

"小丽想买辆新车。她决定找一份工作干。"

小丽突然对工作感兴趣,应理解为是由她想买一辆新车,买新车需要钱而引起的。

要能做到理解这些复杂的关系,必须具有相当广泛领域的知识才行,也就是要依赖于

大型的知识库,而且知识库的组织形式对能否正确理解这些关系,起着很重要的作用。

如果知识库的容量较大。则有一点是比较重要的。即如何将问题的焦点集中于知识库的相关

部分。第二章介绍的一些知识表示方法,如语义网络和剧本等将有助于这项工作的进行。

例如,我们来看一下如下的文章片段:

"接着,把水泵固定到工作台上。螺栓就放在小塑料袋中。"

第二句中的螺栓,应该理解为是用来固定水泵的螺栓。因此,如果在理解第全句时,

就把需用的螺栓置于"焦点"之中,则全句的理解就不成什么问题了。为此,我们需要表示出

和"固定"有关的知识,以便当见到"固定"时,能方便地提取出来。图8.9给出的是一个和固

定水泵有关的分区语义网络。所谓分区语义网络,就是将语义网络中的有关弧和节点集中起

来,组成一个分区。图8.9所示的分区语义网络具有4个分区:S0分区含有一些一般的概

念,如美元、兑换和螺栓等;S1分区含有与购买螺栓有关的特殊实体;S2分区含有与把水

泵固定在工作台上这一操作有关的特殊实体;S3分区含有与同一固定操作有关的特殊实体

等。运用分区语义网络,利用其分区在某些层次上的关联,可以较好地处理集中焦点的问题。

当某一分区为焦点时,则某高层分区内的元素即变为可观察的了。对于上例,当第二句被理

解时,因其讲的?quot;将水泵固定在工作台上"这一事件,因而图8.9分区语义网络示例焦点

处于S2分区。由于S0分区的层次高于S2分区,所以S0分区是可以观察的。当理解第二

句时,显然"螺栓"不能与S2分区的任何元素匹配,因而焦点区由S2变成更低一级的S3分

区,并且使得"螺栓"与B1匹配,匹配的结果使得第二句中的"螺栓"必定是第一句中用来进

行固定的螺栓,从而使得前后两个句子成为一个前后连贯的文章片断。

图 8.9 分区语义网络示例

当输入的文章片断描述的是有关人或物的行为等情节时,可以使用目标结构的方法来

帮助理解。例如

"王强很想喝汽水。他向行人打听最近的冷饮店在哪里。"

对于这样的情节,弄清楚人物的目标及其如何达到目标是理解的重点所在。在上例中,

目标是得到汽水喝,为此,王强必须去冷饮店,而要去冷饮店则必须知道冷饮店的位置,为

达到这一新的子目标,王强应该去询问别人。从而得出达到目标的行为规则:

学习人工智能的时候用道德一些文件!

询问某人 得知冷饮店 去冷饮店 买汽水

喝汽水

为了便于理解,对于这些常常出现的各种目标,可以编写好相应的规划,一旦需要时

就去调用它们,这样,当情节中某些信息省略时,也可以通过这些规划推导出来。

8.4 机器翻译

电子计算机出现之后不久,人们就想使用它来进行机器翻译。只有在理解的基础上才能

进行正确的翻译,否则,将遇到一些难以解决的困难。如果不能较好地克服这些困难,就不能实现真正的翻译。

机器翻译,就是让机器模拟人的翻译过程。人在进行翻译之前,必须掌握两种语言的词

汇和语法。机器也是这样,它在进行翻译之前,在它的存储器中已存储了语言学工作者编好

的并由数学工作者加工过的机器词典和机器语法。人进行翻译时所经历的过程,机器也同样

遵照执行:先查词典得到词的意义和一些基本的语法特征(如词类等),如果查到的词不止一

个意义,那么就要根据上下文选取所需要的意义。在弄清词汇意义和基本语法特征之后,就

要进一步明确各个词之间的关系。此后,根据译语的要求组成译文(包括改变词序、翻译原

文词的一些形态特征及修辞)。

机器翻译的过程一般包括4个阶段:原文输入、原文分析(查词典和语法分析)、译文综

合(调整词序、修辞和从译文词典中取词)和译文输出。下面以英汉机器翻译为例,简要地说

明一下机器翻译的整个过程。

1.原文输入

由于计算机只能接受二进制数字,所以字母和符号必须按照一定的编码法转换成二进制

数字。例如 What are computers这3个词就要变为下面这样3大串二进制代码:

What

are

computers

110110 100000 100010 110011 100111 110001 101110 100100 100000 110100 101100 110001 110011 101111 110010 110100

2.原文分析

原文分析包括两个阶段:查词典和语法分析。

(a) 查词典

通过查词典,给出词或词组的译文代码和语法信息,为以后的语法分析及译文的输出提

供条件。机器翻译中的词典按其任务不同而分成以下几种:

① 综合词典:它是机器所能翻译的文献的词汇大全,一般包括原文词及其语法特征(如

词类)、语义特征和译文代码,以及对其中某些词进一步加工的指示信息(如同形词特征、多

义词特征等)。

② 成语词典:为了提高翻译速度和质量,可以把成语词典放到综合词典前面。…>

③ 同形词典:专门用来区分英语中有语法同形现象的词。…>

④ (分离)结构词典:某些词在语言中与其他词可构成一种可嵌套的固定格式,我们给

这类词定为分离结构词。根据这种固定搭配关系,可以简便而又切实地给出一些词的词义和

语法特征(尤其是介词),从而减轻了语法分析部分的负担。例如:effect of…on

⑤ 多义词典:语言中一词多义现象很普遍,为了解决多义词问题,我们必

须把源语的各个词划分为一定的类属组。…>

通过查词典,原文句中的词在语法类别上便可成为单功能的词,在词义上成为单义词(某

些介词和连词除外)。这样就给下一步语法分析创造了有利条件。

(b) 语法分析

在词典加工之后,输入句就进入语法分析阶段。语法分析的任务是:进一步明确某些词

学习人工智能的时候用道德一些文件!

的形态特征;切分句子;找出词与词之间句法上的联系,同时得出英汉语的中介成分。一句

话,为下一步译文综合做好充分准备。

根据英汉语对比研究发现,翻译英语句子除了翻译各个词的意义之外,主要是调整词序

和翻译一些形态成分。为了调整词序,首先必须弄清需要调整什么,即找出调整的对象。根

据分析,英语句子一般可以分为这样一些词组:动词词组,名词词组,介词词组,形容词词

组,分词词组,不定式词组,副词词组。正是这些词组承担着各种句法功能:谓语,主语,

宾语,定语,状语……,其中除谓语外,都可以作为调整的对象。

…… 此处隐藏:2567字,全部文档内容请下载后查看。喜欢就下载吧 ……
第八章 自然语言理解(4).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wenku/46794.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)