3。4 基于能量和过零率的语音端点检测。11
4 端点检测程序设计13
4。1 语音WAV文件。。13
4。1。1 语音WAV文件的格式…13
4。1。2 语音WAV文件的读取与绘制14
4。2 语音时域特征参数的提取。16
4。2。1 短时能量的提取与绘制。16
4。2。3短时过零率的提取与绘制…。。。。。。。。。。。。。。。。。。。。。。。。。。18
4。3 语音波形的平移。18
4。4 语音信号的端点检测。21
总结 …。。…23
参考文献 24
1 绪论
1。1 语音信号处理研究现状
1。2本文研究内容
语音端点检测是语音识别中首先需要完成的第一个任务也是重要的一步。语音端点检测是指,在既有的语音文件中通过相关算法检测识别出语音段和非语音段,获得语音段的端点(起点和终点)。如果能简单,准确,有效的完成端点检测任务可以大大地减少语音研究工作中的时间和计算量,同时还能减少非语音段在研究中的干扰。因此,语音端点检测的效率在对语音系统的研究处理中显得至关重要,对于广泛深入地进行语音信号相关研究有着深远的意义。端点检测的方法一般分为双门限检测法和基于自相关极大值的检测法,本文主要研究双门限检测法。论文网
本文研究的内容主要如下:
(1)研究语音信号基本知识,了解语音基本分类和其波形特性。
(2)研究语音时域特性,了解短时能量和短时过零率两大参数
(3)编写程序绘制语音波形图和特征参数曲线,结合曲线分析结果规律
(4)通过双门限法进行端点检测,通过短时能量进行第一级判断,再通过短时过零率进行第二级判,最后得到完整的语音段。
1。3本文组织结构
本文提纲段落组织如下:
第一章:绪论部分。说明了对语音信号研究的目的和范围,以及语音信号研究的现状。同时描述了本文所选择的研究方法和实验设计。
第二章:语音信号的基础知识,介绍语音的波形特性和相关分类。
第三章:语音信号时域分析,首先介绍了什么是是与分析以及为什么采用时域分析来研究语音信号,同时重点介绍短时能量和短时过零率两大参数,并介绍双门限法基本原理。
第四章:论述了WAV文件的语音格式,以及波形曲线的平移和参数曲线的绘制,并对得出的波形图进行分析,得出实验结论。
2 语音信号处理的基础知识
2。1 语音信号的波形特性
由于我们无法直观地去认识和规划语音信号,因此我们需要对语音信号进行数字化,这也是对语音信号进行数字处理的基础。通过抽样和量化我们可以得到数字化语音信号。
如图2-1,我们对女声波形图从时域入手分析。语音采样频率为16kHz。纵坐标为振幅幅度,横坐标为样点序号,从图中我们只能看到一段模糊的黑色块状轮廓而不能看清其中的具体情况。因此我们需要对波形图进行放大处理,如图2-2,通过放大后,我们可以清楚的看出波形图的细节。有的部分密集且振幅较大,但有的地方缺略显稀疏,有的部分密集但振幅较小。从总体上看有些部分的波形还呈周期分布。而这些特性也随着时域变化而在不断的变化着 [20]。文献综述
图2-1 女声波形图(横坐标:采样序号;纵坐标:振幅)
图2-2 女声波形放大图(横坐标:采样序号;纵坐标:振幅)