第5章:共振峰特征参数结果分析。应用MATLAB软件绘制共振峰的二维和三维散点图,统计、分析汉语中几个主要单元音和复合元音共振峰的分布规律。
2 语音信号基础知识介绍
语音信号是带有语言信息的语音声波,语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科[2],其目的主要有两点:一是通过处理得到一些反映语音信号的重要特征,对语音信号进行有效传输或存储;二是通过一些处理,以达到一定的目的,如语音合成、说话人识别、识别语音内容等。因此,对语音信号的分析和研究,首先要了解语音信号的一些重要特性。本章将分析语音的产生、语音信号产生的模型、语音信号的特征以及汉语语音的分类。
2。1 语音信号的产生
语音的产生,这是一个复杂的过程,包括一系列生理上和心理上的动作。说话人通过语音表达某种信息时,首先说话人在头脑中产生想要表达的信息,然后将这些信息转化为语音编码,再将这些信息转换成一组神经信号,这些神经信号,控制发声器官的运动,产生特定信息的语音信号。
发声器官主要包括肺、气管、喉、咽、鼻腔、口、唇[2]。它们形成一个连续的管道作为一个整体,如图2。1所示。喉部的部分称为声门,喉部以上的部分称为声道,当说话人发出不同的声音时,声道的形状就会发生改变。
图2。1 发音器官图
人体发声器官可分为三个部分:
(1) 动力区——肺、气管、支气管。肺部为语音的产生提供动力,肺的收缩运动使肺中气体进入气管和支气管,通过声带,使声带振动。
(2) 声源区——声带(喉)。声带是声音的生成机构,声带位于喉的两片薄膜,当气流从肺中呼出时,通过声门,声带发生振动,从而产生声音。
(3) 调音区——口腔及鼻腔。对声音进行调制,每个人的口腔和鼻腔的形状和大小是不同的,这是为什么每个人的声音存在差异的原因之一。
以上的发声器官均为非均匀截面,随时间变化,起到对声音的共振作用。
如图2。2所示为语音产生的过程图,语音产生的过程是肺部收缩使空气进入气管和支气管;通过声带,使声带发生振动,产生声音;经过声带进入声道,使声音某些频率成分进行放大;最后从嘴辐射出声音,形成语音。
声压波声音
能源 激励源 谐振源 辐射源
图2。2 语音产生过程图
2。2 语音信号产生的数字模型
通过对上述语音产生机制的分析,可以将语音生成系统分为三个部分。从肺部的气流经过声带使声带产生振荡,作为“激励系统”;从声门到嘴唇的呼气通道,是“声道系统”;语音从口腔和鼻腔中扩散出去,口腔和鼻腔以外作为“辐射系统”[2]。文献综述
2。2。1 激励模型
激励模型有两种:浊音激励、清音激励。
发浊音时,声带不断开闭产生周期性的脉冲。它和斜三角形的脉冲相似,其数学表达式如下:
(2-1)
公式中,N1为脉冲波上升部分的时间;N2为其下降部分的时间。
浊音激励模型可以表示为:
其中G(z)为斜三角脉冲的全极模型,E(z)为单位脉冲串的z变换形式,Av为幅值因子,C为常数,T为基音周期。