第八章自然语言理解(5)

来源：网络收集时间：2026-06-05

导读：问题，有的系统，人在其中参与太多，有所谓译前加工、译后加工、译间加工，离真正的实际应用还有一段距离。 3.译文综合译文综合比较简单，事实上它的一部分工作(如该调整哪些成份和调整到什么地方)在上一阶段已

问题，有的系统，人在其中参与太多，有所谓"译前加工"、"译后加工"、"译间加工"，离真

正的实际应用还有一段距离。

3.译文综合

译文综合比较简单，事实上它的一部分工作(如该调整哪些成份和调整到什么地方)在上

一阶段已经完成。这一阶段的任务主要是把应该移位的成分调动一下。

如何调动，即采取什么加工方法，是一个不平常的问题。根据层次结构原则，下述方法

被认为是一种合理的加工方法：首先加工间接成分，从后向前依次取词加工，也就是从句子

的最外层向内层加工；其次是加工直接成分，依成分取词加工；如果是复句，还要分别情况

学习人工智能的时候用道德一些文件!

进行加工：对一般复句，在调整各分句内部各种成分之后，各分句都作为一个相对独立的语

段处理，采用从句末(即从句点)向前依次选取语段的方法加工；对包孕式复句，采用先加工

插入句，再加工主句的方法。因为如不提前加工插入句，主句中跟它有联系的那个成分一旦

移位，它就失去了自己的联系词，整个关系就要混乱。

译文综合的第二个任务是修辞加工，即根据修辞的要求增补或删掉一些词，譬如可以根

据英语不定冠词、数词与某类名词搭配增补汉语量词"?quot;、"种"、"本"、"条"、"根"等；

再如若有even(甚至)这样的词出现，谓语前可加上"也"字；又如若主语中有every(每个)、

each(每个)、all(所有)、everybody(每个人)等词，谓语前可加上"都"字等等。

译文综合的第三个任务是查汉文词典，根据译文代码(实际是汉文词典中汉文词的顺序号)找

出汉字的代码。

4.译文输出

通过汉字输出装置将汉字代码转换成文字，打印出译文来。

目前世界上已有十多个面向应用的机器翻译规则系统。其中一些是机助翻译系统，有的

甚至只是让机器帮助查词典，但是据说也能把翻译效率提高50%。这些系统都还存在一些

问题，有的系统，人在其中参与太多，有所谓"译前加工"、"译后加工"、"译间加工"，离真

正的实际应用还有一段距离。

8.5 语音识别

语音识别以语音为研究对象，它是语音信号处理的一个重要研究方向，是模式识别的一

个分支，涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域，甚至还涉

及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解)，其最终目标是

实现人与机器进行自然语言通信。

8.5.1 语音识别的发展历史

语音识别的研究工作大约开始于50年代，Bell实验室的David等人研制成功了第一个

可识别十个英文数字的语音识别系统---Audry系统。这是语音识别研究工作的真正开端。

60年代，计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态规划

(DP)和线性预测分析技术(LP)，对整个语音识别、语音合成、语音分析、语音编码的研究发

展产生了深远影响。

70年代，语音识别领域取得了突破。在理论上，LP技术得到进一步发展，动态时间归

正技术(DTW)基本成熟，特别是提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。在实

践上，实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。

80年代，语音识别研究进一步走向深入，其显著特征是HMM模型和人工神经元网络

(ANN)在语音识别中的成功应用。1988年美国卡内基-梅隆大学运用VQ和HMM技术研制

出了非特定人、大词汇量、连续语音识别系统-SPHINX系统，它可以理解由1000个单词构

成的4200个句子，被认为是语音识别历史的一个里程碑。

进入90年代，随着多媒体时代的来临，迫切要求语音识别系统从实验室走向实用。许

多发达国家如美国、日本、韩国以及IBM、Apple、AT＆T、NTT等著名公司都为语音识别

系统的实用化开发研究投以巨资。我国从70年代后开展研究，从引进国外理论技术入手，

移植到汉语和结合汉语特点进行研究，取得了不少成果并逐步形成了"汉语语音识别"学科。

8.5.2 语音识别的基本原理

语音识别系统的分类方式及依据如下：

根据对说话人说话方式的要求，可以分为孤立字语音识别系统，连接字语音识别系·

统以及连续语音识别系统。

根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。 ·

根据词汇量大小，可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音·

学习人工智能的时候用道德一些文件!

识别系统。不同的语音识别系统，虽然具体实现细节有所不同，但所采用的基本技

术相似，一个典型语音识别系统的实现过程如图8.10所示。

图 8.10 语音识别系统基本原理框图

预处理：包括语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引·

起的噪声影响等，并涉及到语音识别基元的选取和端点检测问题。

特征提取：用于提取语音中反映本质特征的声学参数，如平均能量、平均跨零率、·

共振峰等。

训练：在识别之前通过让讲话者多次重复语音，从原始语音样本中去除冗余信息，·

保留关键数据，再按照一定规则对数据加以聚类，形成模式库。

模式匹配：是整个语音识别系统的核心，它是根据一定规则(如某种距离测度)以及专·

家知识(如构词规则、语法规则、语义规则等)，计算输入特征与库存模式之间的相似

度(如匹配距离、似然概率)，判断出输入语音的语意信息。

8.5.3 语音识别中的难点

目前，语音识别的研究工作进展缓慢，主要表现在理论上一直没有突破。虽然各种新的

修正方法不断涌现，但还缺乏普遍适用性。主要表现在：

· 语音识别系统的适应性差，主要体现在对环境依赖性强，即在某种环境下采集到的语

音训练系统只能在这种环境下应用，否则系统性能将急剧下降；另外一个问题是对用户的错

误输入不能正确响应，使用不方便。

· 高噪声环境下语音识别进展困难，因为此时人的发音变化很大，像声音变高，语速变

慢，音调及共振峰变化等等，这就是所谓Ｌｏｍｂａｒｄ效应，必须寻找新的信号分析处理

方法。

· 语言学、生理学、心理学方面的研究成果已有不少，但如何把这些知识量化、建模并

用于语音识别，还需研究。而语言模型、语法及词法模型在中、大词汇量连续语音识别中是

非常重要的。

· 我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等方面的

认识还很不清楚；其次，把这方面的现有成果用于语音识别，还有一个艰难的过程。

· 语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要解决，如

识别速度、拒识问题以及关键词(句)检测技术(即从连续语音中去除诸如"啊"、"唉"等语音，

获得真正待识别的语音部分)等等技术细节要解决。

为了解决这些问题，研究人员提出了各种各样的方法，如自适应训练，基于最大互信息

准则(MMI)和最小区别信息准则(MDI)的区别训练和"矫正"训练；应用人耳对语音信号的处

…… 此处隐藏：2527字，全部文档内容请下载后查看。喜欢就下载吧 ……

第八章自然语言理解(5).doc 将本文的Word文档下载到电脑，方便复制、编辑、收藏和打印

下载这篇word文档

本文链接：https://www.jiaowen.net/wenku/46794.html（转载请注明文章来源）

上一篇：高中数学__选修2-1 1.1命题及其关系
下一篇：十月有奖征文：歌颂祖国

第八章 自然语言理解(5)

第八章自然语言理解(5)