摘要论文首先介绍了语音信号处理的背景,提出了语音信号元音段检测的重要性,之后阐述了如何使用VC++程序基于短时能量和倒谱设计并开发一个语音信号稳定元音段自动检测软件
该方法是利用Win32 Application工程绘图功能完成,首先对WAV音频文件进行数据导入,做加窗分帧处理,然后计算其短时能量、并画出曲线,然后对语音信号做傅里叶变换,求其倒谱曲线,最后由倒谱曲线得出基音周期,并通过短时能量排除其中虚假的基因周期,由此得到稳定的元音段。25867
关键词  WAV音频文件  语音检测  Win32 Application工程  短时能量与倒谱
毕业论文设计说明书外文摘要
Title  Automatic detection of voice signals vowel
Abstract
Paper introduces the background of speech signal processing, presented the importance of the speech signal detected vowel, then explains how to use VC ++ program based on short-term energy and cepstrum design and development of a stable vowel voice signal automatic detection software.
The method is to use Win32 Application engineering drawing function is completed, the first of WAV audio files for data import, make plus window framing process, and then calculate the short-term energy, and draw the curve, and then do the Fourier transform of the speech signal, seeking its spectral curve inverted, the conclusion that the cepstrum pitch curve, and the exclusion period by which genes false short-term energy, thereby obtaining a stable vowel section.
Keywords  WAV audio files  Voice Detection  Win32 Application Engineering  short-term energy and Cepstral
目   次
1  引言    1
1.1语音信号处理背景    1
1.2  语音信号元音段简介    1
1.3  本文研究的内容和主要工作    2
1.4  本文的内容安排    2
2  相关技术简介    3
2.1  WAV音频文件    3
2.2  短时能量分析    4
2.3  倒谱分析    6
2.4  Win32 application工程简介    7
系统总体设计和具体模块实现    9
3.1  系统的总体设计    9
3.2  具体模块实现    10
3.3  程序演示效果    14
3.4  软件实现的难点    16
结  论    18
致  谢    19
参考文献20
1  引言
1.1语音信号处理背景
语音是人与人之间交流信息必不可少的方式之一。从20世纪60年代开始,语音信号处理技术就已经开始有了理论上的研究。近年来,随着计算机的普及,数字语音信号处理的方式越来越成为语音信号处理方法的主流。只要将模拟语音信号进行数字技术进行处理,就可以将我们看不见、摸不着的语音转化为计算机上直观的数字模型,从而可以简单方便的实现各种与语音相关的处理和检测研究。
语音信号处理的应用主要有以下方面:语音编码、语音合成、语音识别、说话人识别、语音增强和人工神经网络的应用。其中,说话人识别是一个很有应用前景的方面,可以实现基本的身份核实功能,在需要保密的工作环境中也非常有用。
在说话人识别中,如何找出说话人的个性特征是一个很重要的方面。我们都知道,每个人说话的时候,音调、响度、音色各不相同,同一个人在不同时间不同场合下说话的音调和响度也不尽相同,但是音色一般来说因人而异。这就是我们为什么在有的时候只要听到有人说话的声音不需要看到人就能辨别出是谁在说话。所以音色是我们识别说话人的重要手段。
上一篇:兴趣点检测技术在“以图搜图”系统中的应用研究
下一篇:matlab基于视觉的多媒体描述系统设计与实现

16位单片机的语音电子门锁系统【2910字】

一種0~20Hz超低频信号发生...

DSP数字信号处理器茬科里...

ADPCM语音编解码电路设计及FPGA实现【944字】

基于百度语音识别api的语音识别服务

语音信号的基音周期提取方法研究

语音信号的语谱图特征分析

公寓空调设计任务书

国内外图像分割技术研究现状

志愿者活动的调查问卷表

神经外科重症监护病房患...

C#学校科研管理系统的设计

AT89C52单片机的超声波测距...

承德市事业单位档案管理...

中国学术生态细节考察《...

10万元能开儿童乐园吗,我...

医院财务风险因素分析及管理措施【2367字】