教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 文库大全 > 初中教育 >

第八章 自然语言理解(6)

来源:网络收集 时间:2025-09-17
导读: 待进一步研究。 3.模式匹配及模型训练技术 模型训练是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参 数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。 语音

待进一步研究。

3.模式匹配及模型训练技术

模型训练是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参

数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。

语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(DTW)、隐马尔可

夫模型(HMM)和人工神经元网络(ANN)。

DTW是较早的一种模式匹配和模型训练技术,它应用动态规划方法成功解决了语音信

号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好性能。但因其不适

合连续语音大词汇量语音识别系统,目前已被HMM模型和ANN替代。

HMM模型是语音信号时变特征的有参表示法。它由相互关联的两个随机过程共同描述

信号的统计特性,其中一个是隐蔽的(不可观测的)具有有限状态的Markor链,另一个是与

mARKOR链的每一状态相关联的观察矢量的随机过程(可观测的)。隐蔽Markor链的特性要

靠可观测到的信号特征揭示。这样,语音等时变信号某一段的特征就由对应状态观察符号的

随机过程描述,而信号随时间的变化由隐蔽Markor链的转移概率描述。模型参数包括HMM

拓扑结构、状态转移概率及描述观察符号统计特性的一组随机函数。按照随机函数的特点,

HMM模型可分为离散隐马尔可夫模型(采用离散概率密度函数,简称DHMM)和连续隐马尔

可夫模型(采用连续概率密度函数,简称CHMM)以及半连续隐马尔可夫模型(SCHMM,集

DHMM和CHMM特点)。一般来讲,在训练数据足够时,CHMM优于DHMM和SCHMM。

HMM模型的训练和识别都已研究出有效的算法,并不断被完善,以增强HMM模型的鲁棒

性。

学习人工智能的时候用道德一些文件!

人工神经元网络在语音识别中的应用是现在研究的又一热点。ANN本质上是一个自适

应非线性动力学系统,模拟了人类神经元活动的原理,具有自学、联想、对比、推理和概括

能力。这些能力是HMM模型不具备的,但ANN又不具有HMM模型的动态时间归正性能。

因此,现在已有人研究如何把二者的优点有机结合起来,从而提高整个模型的鲁棒。

8.6 应用举例

自然语言理解研究虽然尚存在不少困难的问题,但已有较大进展,并已获得越来越广泛

的应用。下面介绍3个应用实例,即自然语言自动理解系统、机器翻译系统和自然语言问答

系统。

8.6.1 自然语言自动理解系统

1.指挥机器人的自然语言理解系统SHRDLU

SHRDLU系统是由MIT研制的,这个系统能用自然语言来指挥机器手在桌面上摆弄积

木,按一定的要求重新安排积木块的空间位置。SHRDLU可与用户进行人机对话,接收自

然语言,把它变为相应的指令,并进行逻辑推理,从而回答关于桌面上积木世界的各种问题。

系统在LISP的基础上设计了一种MICRO PLANNER程序语言,用它来表示各种指令、事

实和推理过程。如"the pyramid is on the table"(棱椎体在桌子上),MICRO-PLANNER可以把

它变换成如下形式(ON PYRAMID TABLE)。如果要把积木x放到另一块积木y上,则可进

行如下推理:

(THE GOAL(ON ?x ?y)

(OR(ON TOP ?x ?y)

(CLEAR TOP ?y)

(AND(CLEAR TOP ?x) (PUT ON ?x ?y))))

其表达的意义是:要把x放在y上,如果x不在y上,那么首先就要清除x上的一切东

西(CLEAR-TOP ?x),然后再清除y上的一切东西,最后才把x放到y之上(PUT ON ?x ?y)。

在SHRDLU系统的语法中,不仅包含句法方面的特征,而且还包括语式、时态、语态

等特征,并且把句法同语义结合在一起。当输入"Can the table picks up blocks?"(桌子能拿起

积木吗?)时,机器在分析句子的同时还可以在语义上作出判断,只有动物属性的东西才能

"pick up"(拿起)东西,从而回答"No"。系统把句法分析、语义分析同逻辑推理结合在一起,

取得了良好的结果。

2.自然语言情报检索系统LUNAR

LUNAR系统是由伍兹于1972年研制成功的一个自然语言情报检索系统,具有语义分

析能力,用于帮助地质学家比较从月球卫星Apollo-11上得到的月球岩石和土壤组成的化学

成分数据。这个系统具有一定的实用性,为地质学家们提供了一个有用的工具,也显示了自

然语言理解系统对科学和生产的积极作用。

LUNAR系统的工作过程可分为3个阶段。

第一阶段:句法分析

系统采用ATN及语义探索的方法产生人提出的问题的推导树。LUNAR能处理大部分

英语提问句型,有3500个词汇,可解决时态、语式、指代、比较级、关系从句等语法现象。

如英语句子Give me the modal analysis of P205 in those samples.(给我作出这些样本中P205的

常规分析。)What samples contain P205?(哪种样本中含有P205?)等。

第二阶段:语义解析

在这个阶段中,系统采用形式化的方法来表示提问语言所包含的语义,例如:

(TEST(CONTAIN S10046 OLIV))

其中TEST是一个操作,CONTAIN是一个谓词,S10046和DLIV都是标志符,代表了数据

学习人工智能的时候用道德一些文件!

库中所存的事物,S10046是标本号,OLIV是一种矿石。形式表达中还有多种量词,如

QUANT、EVERY等。例如:

(FOR EVERY x1/(SEQ TYPE C):T;(PRINTOU Tx1))

它的含义是:枚举出所有类型为C的样本,并打印出来。

第三阶段:回答问题

在这个阶段中将产生对提问的回答,如:

提问:(Do any samples have greater than 13 percent aluminium)(举出任何含铝量大于

13%的样本

分析后的形式化表达为:

(TEST (FOR SOME x1/(SEQ SAMPLES):T;(CONTAIN x1(NPR*X2/ \'AL203)

(GREATER THAN 13 PCT))))

回答:(yes)

然后LUNAR系统可枚举出一些含铝量大于13%的样本。

8.6.2 机器翻译系统ARIANE

从语言翻译的目标来说,大致有以下3种情况:

1.再创作(Re-creation)

比如翻译小说、诗歌、公共出版物(如报刊、杂志)等。这种翻译实际上是一个再创作的

过程,其目的是在于传递原文中的主题思想和情感等。

2.直译(Diffusion Translation)

这主要是翻译科技文献,这类翻译的要求是准确,不折不扣地反映原文的内容。

3.粗译(Screening Translation)

这种翻译的目的是信息获取和交流,因此要求是快,粗糙一些不成问题。

机器翻译在目前和今后相当长的一段时间内只可能实现后两个目标,第一个目标迄今为

止还只能是一个"美丽的梦想"。早期的机译主要是从事"粗译"工作。这种系统目前仍有市场,

如SYSTRAN(俄/法,美国),ATLASⅡ(日/英,日本)等。这些系统要求自动化程度高,尽

可能少作译前、译后的人工编辑。大约在60年代后期,人们开始从事"直译"的系统研究。

这类系统的输出质量较好,能够为职业译员所接受(作修改),从而起到降低翻译工作量的作

用。这类系统只能在某一个特定的领域中完成某些特定形式的文本翻译,如PIVOT(NEC)、

HICAT(Hitachi)、LOGOS(美国)、METAL(美国)、ARIANE(法国)、SUSY(德国)等等。这些

系统一般都非常庞大。机器翻译研究除了全自动翻译系统之外,另 …… 此处隐藏:3007字,全部文档内容请下载后查看。喜欢就下载吧 ……

第八章 自然语言理解(6).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wenku/46794.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)